Im Internet befindet sich eine Vielzahl von Informationen zum verschiedenen gesundheitsbezogenen Themen. Mit der Einführung des Web 2.0 haben sich in den letzten zehn Jahren eine Reihe von interaktiven Online-Foren etabliert, auf denen betroffene Personen zum einen die Möglichkeit haben, untereinander Erfahrungen auszutauschen und sich zum anderen ratsuchend an medizinische Experten wenden können. Der in diesen Foren geführte Diskurs enthält zahlreiche frei zugängliche Informationen über Fragen und Probleme der Betroffenen, die potentiell auch für die medizinische Versorgung relevant sind.
Da es sich bei den so geführten Diskursen um Texte handelt, kommen etablierte statistische Verfahren zur Analyse dieser Daten nicht in Frage. Andererseits stoßen aber auch die klassischen interpretativen Methoden der qualitativen Sozialforschung angesichts der im Netz verfügbaren riesigen Textkorpora schon allein aus forschungspraktischen Gründen an ihre Grenzen.
Zwar stehen für die Analyse solcher Textkospora einige neuere Analysemethoden zur Verfügung (“Computational Linguistics”, “Natural Language Processing”, “Text Mining” etc.), jedoch sind dise in den Sozialwissenschaften bisher wenig bis gar nicht etabliert.
In diesem Blog werde ich in unregelmäßigen Abständen über meine eigene Forschung auf dem Gebiet der quantitativen Textanalyse berichten.