Analyse der DFG Fachkollegienwahl 2015 — Teil I

Die Deutsche Forschungsgemeinschaft (DFG) ist die europaweit größte Forschungsförderungsorganisation mit einem Jahresetat von aktuell etwa 3 Milliarden Euro (2016). Die Aufgabe der DFG besteht in der Auswahl und Finanzierung wissenschaftlicher Forschungsvorhaben an Hochschulen und Forschungsinstituten.

Laut DFG werden eingereichte Förderanträge in einem mehrstufigen Entscheidungsverfahren “von ehrenamtlich tätigen Gutachterinnen und Gutachtern nach ausschließlich wissenschaftlichen Kriterien beurteilt.” In einem zweiten Schritt werden diese Fachgutachten von Mitgliedern sogenannter Fachkollegien bewertet. Diese treffen eine Vorauswahl und entscheiden, ob ein Antragsverfahren weitergeführt oder eingestellt wird. Die eigentliche Förderentscheidung liegt jedoch beim DFG-Hauptausschuss.

Für die Wahl der Fachkollegien wurde im Jahr 2014 eine neue Wahlordnung verabschiedet, nach der jene Kandidaten mit den meisten Wahlvorschlägen einen Platz auf den Wahllisten bekommen (stimmt das?). Dies habe, so der Bamberger Historiker Hartwin Brandt in zwei Beiträgen für die Frankfurter Allgemeine Zeitung (FAZ, 17.05.2017, 18.10.2017) zu inoffiziellen Absprachen zwischen Hochschulvertetern geführt – mit dem Ziel, die eigenen Kanditaten auf die Wahllisten zu platzieren.

Brandt, der für den Bereich “Klassische Philologie” einen “Nordverbund” bestehend aus den Universitäten Bremen, Greifswald, Hamburg, Kiel und Rostock identifiziert, vermutet, dass eine “detaillierte Analyse der mehr als 600 Seiten umfassenden DFG-Liste der Kandidierenden etliche weitere Auffälligkeiten und Kompensationsgeschäfte zutage fördern” dürfte und mutmaßt, dass “soziologische Netzwerk- und Freundschaftsforscher ihre Freude an diesem Datensatz haben werden”.

Die von der DFG veröffentlichte “Liste der Kandidierenden für die DFG-Fachkollegienwahl 2015” (Stand 17.09.2015) ist ein 617 A4-Seiten umdassendes PDF-Dokument. Sie kann als PDF-Datei von den Internetseiten der DFG heruntergeladen werden (Link). Dazu kommt eine ebenfalls von der DFG veröffentlichte Liste mit den Wahlergebnissen.

Um die in beiden Dokumenten enthaltenen Angaben statistisch auswerten zu können, müssen diese zunächst in ein maschinenlesbares Format überführt werden. Mit der Funktion exctract_text() aus dem R-Paket tabulizer können die Bezeichnungen und Nummern der einzelnen Fachgebiete ausgelesen werden. Zwar lassen sich mit der exctract_tables()-Funktion prinzipiell auch in PDF-Dateien enthaltene Tabellen auslesen. Meine Versuche, die auf das entsprechende PDF-Dokument anzuwenden, waren jedoch leider nicht von Erfolg gekrönt, sodass ich die Daten im Copy-and-Paste-Verfahren manuell in eine Excel-Datei üoberführt habe. Da Copy-and-Paste ein vergleichsweise fehleranfälliges Verfahren ist, würde ich mich freuen, von den Lesern dieses Beitrags auf eventuelle Fehler hingewiesen zu werden. Der Datensatz kann von meinem Github-Repository heruntergeladen werden (zur Zeit nur im Format .rda).

Der Datensatz df.dfg enthält die folgenden Variablen:

  • wb.nummer: Nummer des Wissenschaftsbereichs;
  • wb.name: Name des Wissenschaftsbereichs;
  • fg.nummer: Nummer des Fachgebiets;
  • fg.name: Name des Fachgebiets;
  • fk.nummer: Nummer des Fachkollegiums;
  • fg.name : Name des Fachkollegiums;
  • fach.nummer: Nummer des Fachs;
  • fach.name: Name des Fachs;
  • person.name: Name und Vorname der kandidierenden Person;
  • person.sex: Geschlecht der kandidierenden Person;
  • person.inst: Institution der kandidierenden Person;
  • inst.von: vorschlagende Institutionen
  • inst.von.kat: Kategorisierung der vorschlagenden Institution in: Hochschule vs. Fachgesellschaft vs. Sonstiges;
  • anzahl.plaetze: Anzahl wählbarer Personen pro Fachkollegium;
  • anzahl.kandidaten: Anzahl kandidierender Personen pro Fachkollegium;
  • person.platz: Platzierung der kandidierende Person (Wahlergebnis)
  • person.stimmen: Anzahl der Stimmen, mit denen der Kandidierende gewählt wurde (Wahlergebnis);
  • person.gewaehlt: Wurde die kandidierende Person gewählt?
## Observations: 9,695
## Variables: 18
## $ wb.nummer         <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,...
## $ wb.name           <fct> Geistes- und Sozialwissenschaften, Geistes- ...
## $ fg.nummer         <dbl> 11, 11, 11, 11, 11, 11, 11, 11, 11, 11, 11, ...
## $ fg.name           <fct> Geisteswissenschaften, Geisteswissenschaften...
## $ fk.nummer         <chr> "FN_101", "FN_101", "FN_101", "FN_101", "FN_...
## $ fk.name           <chr> "Alte Kulturen", "Alte Kulturen", "Alte Kult...
## $ fach.nummer       <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,...
## $ fach.name         <chr> "Ur- und Frühgeschichte (weltweit)", "Ur- un...
## $ person.name       <chr> "Bemmann, Jan", "Brather, Sebastian", "Brath...
## $ person.sex        <fct> m, m, m, w, m, m, m, m, m, w, w, w, m, m, m,...
## $ person.inst       <chr> "U Bonn", "U Freiburg", "U Freiburg", "RGZM"...
## $ inst.von          <chr> "U Bonn", "U Freiburg", "WGL", "WGL", "Dt. V...
## $ inst.von.kat      <chr> "Hochschule", "Hochschule", "Sonstiges", "So...
## $ anzahl.plaetze    <dbl> 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3,...
## $ anzahl.kandidaten <dbl> 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9,...
## $ person.platz      <dbl> 7, 5, 5, 6, 2, 2, 9, 8, 8, 1, 1, 1, 3, 3, 4,...
## $ person.stimmen    <dbl> NA, NA, NA, NA, 195, 195, NA, NA, NA, 255, 2...
## $ person.gewaehlt   <lgl> FALSE, FALSE, FALSE, FALSE, TRUE, TRUE, FALS...

Im Bereich der medizinischen Fächer gibt es die Besonderheit, dass für Kandidaten, die an einem Universitätsklinikum beschäftigt sind, als Institution das Klinikum, und nicht die Universität genannt wird. Um tatsächlich vorhandene Netzwerkstrukturen rekonstruieren zu können, habe ich immer dann, wenn sich ein Klinikum eindeutig einer Universität zuordnen ließ, in der Variable Institution den Namen der Universität abgespeichert (z.B. “Universitätsklinikum Münster als "Universität Münster”). Falls keine eindeutige Zuordnung möglich war, habe ich den Namen des Klinikums nicht überschrieben (z.B. “Universitätsklinikum Schleswig-Holstein”).

Die Liste der Kandidierenden lässt sich in vier “Wissenschaftsbereiche” untergliedern, denen die Fachkollegien zugeordnet sind. Zuguterletzt ist jedem Fachkollegium eine Reihe von Fächern zugeordnet (z.B. “Literaturwissenschaften” in “Ältere deutsche Literatur”, “Neuere deutsche Literatur” etc.).

  • Geistes- und Sozialwissenschaften
    • Geisteswissenschaften (Fachkollegium 101–108)
    • Sozial- und Verhaltenswissenschaften (Fachkollegium 109–113)
  • Lebenswissenschaften
    • Biologie (Fachkollegium 201–203)
    • Medizin (Fachkollegium 204–206)
    • Agrar-, Forstwissenschaften und Tiermedizin (Fachkollegium 207)
  • Naturwissenschaften
    • Chemie (Fachkollegium 301–307)
    • Physik (Fachkollegium 308–311)
    • Mathematik (Fachkollegium 312)
    • Geowissenschaften (Fachkollegium 313–318)
  • Ingenieurswissenschaften
    • Maschinenbau und Produktionstechnik (Fachkollegium 401–402)
    • Wärmetechnik/Verfahrenstechnik (Fachkollegium 403–404)
    • Materialwissenschaft und Werkstofftechnik (Fachkollegium 405–406)
    • Informatik, System- und Elektrotechnik (Fachkollegium 407–409)
    • Bauwesen und Architektur (Fachkollegium 410)

In den nächsten Monaten werde ich mich in einer Reihe von Blogposts an einer statistischen Analyse der DFG-Kandidierendenliste versuchen.

Aktualisiert am: 17.02.2018

Advertisements

About norbert

Biometrician at Clinical Trial Centre, Leipzig University (GER), with degrees in sociology (MA) and public health (MPH).
This entry was posted in Visualizing Data and tagged , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.