SZIENTOMETRIE : Zitatenanalyse

1. Einführung
2. Kurze Geschichte
3. Begriffe
4. Zitatenanalyse
5. Anwendungen
6. Evaluative bibliometrische Verfahren:
    I.  Die sogenannte "Peer Review" Methode
    II. Anzahl der Veröffentlichungen
    III. Zitatenanalyse: Problematik
7. Zitate als Retrievalsmethode
    I. Zitatengruppen- oder Clusteranalyse
    II. Bibliographische Kopplung
8. Das Verzeichnis der Verzeichnisse: SCI
   I. Der SCI als Datenquelle
   II. Aufbau des Verzeichnisses
   III. Bibliometrische Indikatoren der JCR
    IV. Aufbau von JCR
    V. SCI auf CD-ROM
    VI. SCI online
    VII. SCI im Internet
    VIII. Kritik und Problematik
9. Präsentation der Ergebnisse
10. Kommentare
11. Literatur

1. Einführung
Wie misst man Wissenschaft und wissenschaftliche Produktion?
Unter Informetrie versteht man die Anwendung mathematischer Methoden auf die Sachverhalte des Informationswesens. Sie ist eine Disziplin im Überscheidungsbereich zwischen Mathematik und Informationswissenschaft. Die Informetrie wird auch Bibliometrie oder Szientometrie genannt.

Der Begriff  "Bibliometrie" wurde 1969 von A. Pritchard geprägt. Zweck und Definition der Bibliometrie ist die Anwendung mathematischer und statistischer Methoden zur Erklärung der Prozesse der schriftlichen Mitteilungen, sowie der Natur und des Entwicklungskurses eines Wissenschaftsgebietes, durch Zählung und Analyse der verschiedenen Aspekte der schriftlichen Kommunikation.

Derzeit hat sich die Bibliometrie als die bedeutendste Methode für die Bewertung wissenschaftlicher Arbeiten erwiesen.  Sie ist die Metrik des Buchwesens und untersucht unter Einsatz mathematisch-statistischer Methoden die quantitativen Regelhaftigkeiten von Printmedien im Informationsstrom in Beziehung zur Wissenschaftstheorie und Forschung.
Eine modernere Definition von Hawkins lautet: "Quantitative Analyse der bibliographischen Aspekte eines Literaturthemas". Diese Definition hat den Vorteil, daß sie den quantitativen Aspekt dieser Wissenschaft hervorhebt.

Die Zitatenanalyse ist ein Gebiet der Bibliometrie, das sich mit dem Studium der Beziehungen zwischen zitierten und  zitierenden Arbeiten und ihrer Anwendung als bibliometrische Untersuchungsmethode beschäftigt. Als bibliometrischen Parameter verwendet die Zitatenanalyse die Zählung der auf eine bestimmte Arbeit, ein bestimmtes Dokument oder einen bestimmten Verfasser entfallenden Zitate. Je größer die Zitierhäufigkeit ist, desto höher wird ihr Wert veranschlagt.

2. Kurze Geschichte
Die erste bibliometrische Untersuchung erschien 1917 und war eine von Cole und Eales verfaßte Veröffentlichung  einer statistischen Analyse der Literatur über Anatomie in dem Zeitabschnitt zwischen 1550 und 1860, um die Schwankungen des Interesses in dieser Disziplin zu zeigen. P. Gross und E. Gross  waren 1927 die ersten, die Zitate als bibliometrische Datenquellen verwendeten. Sie zählten und analysierten die in den einzelnen Artikeln einer chemischen Zeitschrift angeführten Zitate, und kamen zu einer Liste von Zeitschriften die sie als unentbehrlich für die chemische Ausbildung betrachteten.
1966 war in der Sowjetunion das Buch "Nauka o nauke" von G.M. Dobrov mit dem Untertitel "Vvedeniev obscee naukoznanie" erschienen. 1969 wurde diese Veröffentlichung als "Wissenschaftswissenschaft" zum ersten Male in deutscher Sprache herausgegeben. Nach Dobrov ist die Wissenschafts-wissenschaft die komplexe Untersuchung und Verallgemeinerung des Funktionierens wissenschaftlicher Systeme mit dem Ziel, das Potential der Wissenschaft zu verstärken und die Effizienz des wissenschaftlichen Prozesses mit Hilfe organisatorischer Mittel zu erhöhen.
Einige Monate früher als Pritchard hatten Nalimov und Mul'cenko, ebenfalls Russen, den Begriff Szientometrie oder Wissenschaftsmetrie (auf russisch "naukometrija") eingeführt. Nach ihrer Definition ist die Szientometrie (engl. scientometrics) die Anwendung quantitativer Methoden auf das Studium der Geschichte der Wissenschaft als Informationsprozeß.
Ein anderer Terminus, der auch häufig (stammt aus der DDR) verwendet wird, ist die Informetrie. Dieser Terminus wurde von Blackert und Siegel eingeführt, da viele Arbeiten,  die gegenwärtig als bibliometrische gestempelt werden, nicht dem Zweck dienen, einen Beitrag zur Bibliothekswissenschaft zu leisten. Um ihre Beziehung zur Informatik zu betonen, wird dieses Fachgebiet Informetrie benannt und definiert als die Lehre der Anwendung mathematischer Methoden auf die Sachverhalte des Informationswesens zur Beschreibung und Analyse ihrer Phänomene, zum Auffinden ihrer Gesetze und zur Unterstützung ihrer Entscheidungen.
Informetrie, Szientometrie und Bibliometrie überschneiden sich. Die Verwendung des einen oder anderen Terminus hängt sehr stark davon ab, welcher Aspekt, der bibliothekarische, der wissenschaftliche oder der informatische, herauszuheben ist, deshalb wird in dieser Arbeit von Bibliometrie gesprochen.
Seitdem hat diese Art von Untersuchungen ständig mehr Anhänger gefunden. 1969 zählte Pritchard schon über 700 Items. Heute gibt es Zeitschriften, die sich nur mit diesem Thema beschäftigen, wie z.B. Scientometrics, eine Zeitschrift die seit 1978 besteht. Eine vom Autor selbst durchgeführte Literaturrecherche in der Datenbank LISA (Library and Information Science Abstracts) nach dem freien Suchbegriff "scientometric? or bibliometric?" ergab schon Anfang 1990 1262 Treffer, von denen sich 508 mit Zitatenanalyse beschäftigen.
Derzeit existiert sogar eine International Society for Scientometrics and Informetrics ISSI, die regelmäßig Tagungen organisiert.
 

3. Begriffe
Sehr wichtig ist der Unterschied zwischen Zitat (engl. citation) und Referenz (engl. reference).
Formale Aufbau einer wissenschaftlichen Veröffentlichung (engl. paper) zeigt eine standardisierte Struktur:

Titel, Autoren, Anschriften (Affiliation, Corporation), Abstrakt, Deskriptoren, Fulltext, Referenzen.

Ein Bestandteil ist die Aufführung der Forschungsergebnisse, auf denen die Arbeit aufbaut. Es wird verlangt, daß der Autor die Verwendung bereits bekannter Methoden oder Resultate zitiert, die zu seiner Arbeit in enger inhaltlicher Beziehung stehen. Die Angabe der Zitate erfolgt in der Form eines vereinheitlichten kurzen Hinweises auf das zitierte Dokument und hängt sehr stark vom zitierenden Verfasser sowie von der Quelle ab, denn jede Zeitschrift oder Datenquelle verwendet besondere Regeln oder Empfehlungen zur Darstellung der Referenzen (Notes for Contributors, Instructions for Authors).

Ebenso kann die Plazierung der Referenzen im Text unterschiedlich sein. Sie können in den fortlaufenden Text eingebettet sein, in einer Fußnote erscheinen, oder meistens in Form einer Literaturliste am Schluß der Veröffentlichung präsentiert werden.

Definition:
Enthält die Veröffentlichung X eine bibliographische Note, in der die Veröffentlichung Y beschrieben oder verwendet wird, dann enthält X (citing document) eine Referenz  zu Y, und bekommt Y (cited document) ein Zitat von X.

 

4. Zitatenanalyse
Die Zitatenanalyse beschäftigt sich mit dem Studium der Beziehungen zwischen zitierten und zitierenden Arbeiten und ihrer Anwendung als Untersuchungsmethode. Sie zeigt, welchen Einfluß die betrachtete Arbeit auf die wissenschaftliche Gemeinschaft hat. Sie mißt den "Nutzen" (Auswirkung, Resonanz, Rezeption, Impakt, üblich ist der englischsprachige Terminus technicus "Impact"), den diese Arbeit für andere Wissenschaftler hat oder gehabt hat, sagt aber nichts Endgültiges über ihre Qualität aus. Es ist jedoch sehr wahrscheinlich, daß eine häufig zitierte Arbeit wichtige Informationen enthält.
Zitatenanalyse bezeichnet die Auswertung von Zitaten im Rahmen einer empirischen Untersuchung. Als bibliometrische Quellen stehen die zitierten und die zitierenden Arbeiten.
Diese Daten werden aus besonderen Verzeichnissen wie z. B. "Science Citation Index" gewonnen, die von den sogenannten "counting houses" angeboten werden.
Zitatenanalyse können auf verschiedenen Stufen der Komplexität vorgenommen werden. Auf der untersten Stufe kann ein einzelnes Dokument, ein Zeitschriftenartikel, Buch oder graue Literatur die Einheit der Analyse sein. Dadurch kann die Frage beantwortet werden, wie oft, wann und von wem das Dokument zitiert worden ist. Auf der nächsten Stufe können alle Veröffentlichungen eines oder mehrerer Autoren, von Körperschaften oder Zeitschriften untersucht werden. Schließlich sind Studien  über Universitäten oder alle aus einem Staat stammenden Veröffentlichungen sowie über Eigenschaften und Entwicklung bestimmter Wissensgebiete möglich.

5. Anwendungen
Unter den wichtigsten bibliometrischen Anwendungen der Zitatenanalyse sind folgende zu erwähnen:

1)  Auswahl von Monographien und Zeitschriften in der bibliothekarischen Erwerbung
Ein sehr wichtiges Kriterium für die Erwerbung von Monographien und Zeitschriften, vor allem in Fachbibliotheken, liefert deren Zitierungshäufigkeit, wie zahlreiche Untersuchungen dieser Art  illustrieren. Zu diesem Zweck wurde von  E. Garfield der sogenannte "Impact Factor" eingeführt, von dem später gesprochen wird.

2) Auswertungen von Sammlungen und Bibliographien
Diese Auswertungsmethoden beruhen vor allem auf der Möglichkeit, "ranking lists" (Ranglisten) aufzustellen. Ranglisten werden auch nach verschiedenen bibliometrischen Indikatoren erstellt  (Beispiele sind bei der Beschreibung vom SCI-JCR zu finden).  Die gebräuchlichsten Ranglisten sind jene, die nach der Anzahl der erhaltenen Zitate aufgebaut werden. Solche Listen werden jedoch mehr für die Auswahl als für die Auswertung von Sammlungen verwendet.

3) Untersuchung der Merkmale von Fachliteraturen
Eines der am meisten untersuchten Merkmale einer Fachliteratur ist das sogenannte "Veralten" (engl. obsolescence). Unter Veralten wird der Verfall mit der Zeit der Gültigkeit und Benutzbarkeit der Information verstanden. Dies ist sehr wichtig für die Bibliothekare, die ständig wachsende Sammlungen in beschränkten Räumen führen. Die Einschätzung des Alterns einer Literatur wird gewöhnlich durch die Verminderung der Zitate mit der Zeit angegeben.
Dafür wurde von Brookes der bibliometrische Indikator, das Halbleben oder Halbwertszeit (engl. half life), eingeführt, der später ausführlicher erörtert wird. Diese Untersuchungen können bei Klärung folgenden Fragen helfen:  ob eine Zeitschrift rückwärtig ergänzt werden sollte, ob und welcher Teil einer Zeitschrift magaziniert oder makuliert werden könnte und ob und wann eine Zeitschrift gebunden werden sollte.
Als Instrument für den Bestandsaufbau bei Zeitschriften in wissenschaftlichen Bibliotheken könnte sie die Objektivität von Entscheidungen vergrößern, da sie unabhängig von den Einflußnahmen von Benutzergruppen getroffen werden könnten.

4) Historische und soziologische Anwendungen.
Garfield und seine Mitarbeiter vom ISI (Institute for Scientific Information) haben bewiesen, daß:
a) Zitate eine wichtige Rolle beim Studium der Geschichte der Wissenschaften spielen können,
b) eine graphische Darstellung (genannt "Historiograph") eine schnelle Übersicht über die Entwicklung einer bestimmten Disziplin oder deren Entwicklung in einem Land ergeben kann,
c) solche graphische Darstellungen in der Praxis problemlos zu erhalten sind.
Darunter zählt auch die Ermittlung der "klassisch zitierten" Arbeiten (engl. "citation classics") einer bestimmten Disziplin.
Solche Arbeiten werden mit einer größeren Häufigkeit innerhalb eines Fachgebietes zitiert. Die Festlegung des "klassischen" Niveaus zeigt sich aber nicht so einfach. So kann eine absolute Häufigkeit nicht angenommen werden, da in diesem Fall fast nur Artikel von bestimmten Zeitschriften (jenen mit sehr hohem Impaktfaktor, d.h. Zeitschriften die selbst viel häufiger als alle anderen zitiert werden) "citation classics" wären. Listen von "citation classics" erscheinen regelmäßig in der Zeitschrift "Current contents".

5) Andere evaluative bibliometrische Untersuchungen.
Diese Anwendungen umfassen auch die Einschätzung :
a) der Auswirkung einer individuellen Arbeit ,
b) der Eminenz eines bestimmten Forschers , und
c) des Prestiges und der Leistung einer bestimmten Forschungsanstalt , Firma oder eines Landes.

Zitatenanalyse ist heute eine der wichtigsten Methoden der akademischen  Evaluation.

6. Evaluative bibliometrische Verfahren

I.  Die sogenannte "Peer Review" Methode
Diese Methode verwendet seit mehr als 35 Jahren die National Science Foundation der USA zur Entscheidung, welche Wissenschaftler Forschungsanträge zur Förderung der Wissenschaften erhalten, und dient heutzutage zum gleichen Zweck in den meisten europäischen Ländern,  inklusive Österreich. Sie funktioniert auf folgende Weise:
Zuerst verfaßt der Kandidat ein schriftliches Ansuchen, in dem er seine frühere Tätigkeit, seine Qualifikationen und seine geplante Forschungsarbeit beschreibt. Dieses Ansuchen erhält der sogenannte Programm-Direktor. Dieser bestimmt, welchem Fachgebiet die vorgeschlagene Arbeit angehört, und wählt dann eine Anzahl von Referenten (Fachleute in diesem Gebiet), die befragt werden, ob der Vorschlag als ausgezeichnet, sehr gut, gut, annehmbar oder schlecht bewertet wird. Aufgrund dieser Bewertungen trifft der Programm-Direktor  eine Entscheidung.
Die häufigste Kritik an dieser Methode ist die sogenannte "old boy" (alte Freunde) Hypothese, nach der eine Clique von eminenten  Wissenschaftlern begünstigt wird. So würden die Entscheidungen des Programm-Direktors stärker von dem Antragsteller selbst als von seiner vorgeschlagenen Arbeit abhängen.
Diese Methode wird aber nicht zur Einschätzung der Auswirkung einer wissenschaftlichen Arbeit oder der Verdienste eines Wissenschaftlers verwendet, da die für ein objektives Ergebnis benötigte  Anzahl der Referenten sehr groß und deswegen unrealistisch wäre.

II. Anzahl der Veröffentlichungen
Hingegen fügt heutzutage jeder Wissenschaftler seinem Lebenslauf eine Liste seiner Veröffentlichungen, vor allem bei Bewerbungen und Preisausschreiben, bei, um seine Verdienste zu dokumentieren. Die Anzahl der Veröffentlichungen ist der einfachste und bekannteste Indikator.  Sie stellt das Gesamtvolumen der Forschungsproduktivität dar,  ist aber quantitativer Natur und gibt kaum Information über die Auswirkung und Qualität dieser Arbeiten.
Erhält der Herausgeber einer wissenschaftlichen Zeitschrift ein Manuskript zur Veröffentlichung, so wählt er qualifizierte Referenten aus, die um ihre Fachmeinung befragt werden. Dem Autor bleibt die Identität der Referenten seiner Arbeit unbekannt, leider und unverständlicherweise wird aber bei Veröffentlichungen in den meisten Zeitschriften den Referenten die Identität des Verfassers der Arbeit nicht verschwiegen, was sehr leicht zu einer subjektiven Meinungsbildung führen kann.
Dies ist der Grund, warum es junge, noch unbekannte Wissenschaftler viel schwieriger als schon etablierte haben, ihre Ergebnisse zu veröffentlichen. Obwohl die Veröffentlichung in einer wissenschaftlichen Zeitschrift bestimmten Qualitätsanforderungen obliegt, sind diese aber von einer Zeitschrift zur anderen sehr unterschiedlich und daher nicht vergleichbar.
Außerdem weist dieser Parameter viele Nachteile auf, von denen zu erwähnen sind:
a) Die Wiederveröffentlichung derselben Arbeit in verschiedenen Versionen in mehreren Zeitschriften:
Daß nur die Anzahl der veröffentlichten Arbeiten als Indikator verwendet wird, kann dazu führen, daß eine Arbeit mehrmals oder in mehreren Teilen veröffentlicht wird, um den Wert dieses Parameters zu erhöhen. Dies beeinträchtigt dessen bibliometrische Aussage.
b) Auch die ständig wachsende Anzahl der Arbeiten, die von mehreren Autoren verfaßt werden, kann die Analyse verfälschen, da nicht immer alle Verfasser im gleichen Ausmaß beigetragen haben, oder, was häufig der Fall ist, eine Co-Autorschaft  willkürlich angegeben wird.
Trotz dieser Einwände wird dieser Indikator noch heute verwendet, und dient der Erstellung anderer, besserer bibliometrischer Parameter.
Nachteil: Die Subjektivität und Willkürlichkeit der Herausgeber wissenschaftlicher Zeitschriften bei der Auswahl von den zu veröffentlichen Arbeiten.
 

III. Zitatenanalyse
In diesem Falle ist der einfachste Indikator die bloße Anzahl der Zitate. Wie E. Garfield ganz klar formuliert, zeigt dieser Indikator, welche Auswirkung eine konkrete Arbeit auf die wissenschaftliche Gemeinschaft hat; sie mißt den Nutzen (engl. "impact"), den diese Arbeit für andere Wissenschaftler hat, denn das Zitieren in einer wissenschaftlichen Publikation bedeutet die Anerkennung der Auswirkung und des Einflusses, die der zitierte Autor auf die betreffende Arbeit ausgeübt hat.
Zitate sind sehr beliebte bibliometrische Untersuchungsparameter, denn sie sind unaufdringlich und sehr leicht zu erhalten. Anders als Fragebogen und Befragungen bedürfen sie nicht der absichtlichen Kooperation des Befragten, was dessen Antwort beeinflussen könnte.
Sie sind "Wegweiser", die nach jeder Information hinterlassen wurden, und die als solche verwendet werden sollen.

Problematik der Zitatenanalyse
Falls die Eigenschaften der Untersuchung es ermöglichen, sollten bei der Zitatenanalyse zitierende und zitierte Arbeiten nach Autopsie bearbeitet, und die Zitierungsgründe analysiert werden. Eine gute Anwendung des Zitatenanalyseverfahrens setzt aber die Kenntnis dieser Probleme voraus, damit, falls möglich, die notwendigen Maßnahmen zu deren Vermeidung getroffen werden können. Nun werden hier die bekanntesten Probleme und Einwände der Zitatenanalyse aufgelistet, sowie ihre üblichen Beseitigungsmethoden:
1) Ein typographischer Fehler
Der kann leicht verursachen, daß ein wichtiges Zitat nicht berücksichtigt wird. Solche Fehler können aber bei jeder EDV- Untersuchung auftreten. Nur eine sorgfältige Durchführung der Arbeit kann dieses Problem vermeiden.
2) Die willkürliche Auslassung eines wichtigen Zitates
Sie kann aus verschiedenen Gründen eintreten. Die wichtigsten sind:
a) Die Arbeit, die zitiert werden sollte, ist dem Autor nicht bekannt
In diesem Fall hat sie wahrscheinlich nicht die entsprechende Verbreitung gefunden. Die Zitatenanalyse wird dann deren Verfasser die Notwendigkeit einer besseren Mitteilung seiner Arbeit signalisieren. Dieses Phänomen ist in der Bibliometrie unter dem Namen "Mendelsyndrom" bekannt, da der berühmte Artikel von Mendel seinerzeit in einer unbekannten Zeitschrift erschien und unbeachtet blieb. Dabei sollten die sogenannten "schlummernden" Arbeiten erwähnt werden. Darunter versteht man Arbeiten, die ursprünglich sehr wenige Zitate aufzeigten, aber nach einigen Jahren wiederentdeckt und sehr häufig zitiert werden. Bibliometrische Analysen ermöglichen ihre Ermittlung.
b) Das Auslöschen durch Eingemeindung oder Einverleibung (engl. obliteration by incorporation)
Von diesem Phänomen sprach zum ersten Mal der in der Bibliometrie sehr berühmte Forscher Merton. Damit bezeichnete er jene Ideen, die so populär, assimiliert und bekannt geworden sind, daß sie als kollektives Eigentum oder selbstverständliche Hypothese betrachtet und nicht mehr zitiert werden. Diese Ideen sind aber so bekannt, daß sich bei ihnen normalerweise eine bibliometrische Untersuchung erübrigt, oder wenigstens keine gravierende Fehler auftreten können.
c) Anstatt originaler Arbeiten von unbekannten Autoren werden "Review-Artikel" von bekannteren Verfassern zitiert
Unter einem "Review-Artikel" versteht man einen Artikel, der keine neuen Ergebnisse oder Theorien enthält, sondern eine retrospektive, kritische Darstellung der Entwicklung  und des Standes der Forschung in einem bestimmten Gebiet. Es gibt sogar Zeitschriften, die hauptsächlich diese Art Arbeiten veröffentlichen, wie z.B. Physics Reports. Solche Artikel, die einen sehr hohen bibliographischen Wert besitzen, werden den in diesem Fach schon bekannten Forschern anvertraut. Aus diesem Grund kann es schon geschehen, daß der zitierende Autor sich auf das Zitat des Review-Artikels beschränkt. Diese Art des Zitierens wird dem sogenannten "Matthew Effekt" zugeschrieben, nach dem bekannte Wissenschaftler eine übertriebene Anzahl von Zitaten erhalten.
d) Die Unzugänglichkeit der Dokumente
Manche Dokumente sind dem zitierenden Verfasser wegen ihrer Sprache, ihrer "tragenden" Zeitschrift (einer eher unbekannten und nicht leicht erhältlichen Zeitschrift) oder Quelle (Report, Preprint, Dissertation oder irgendeine graue Literatur), oder wegen Geheimhaltung nicht leicht zugänglich, und werden aus diesen Gründen  nicht zitiert.
e) Die künstliche Beschränkung der Anzahl der Zitate
Die meisten Autoren gehen sehr sparsam mit der Anzahl der Zitate um. Falls die Arbeit eine bestimmte Länge nicht überschreiten soll, wird sicher bei den Referenzen gespart, was vom Gesichtspunkt des Verfassers verständlich ist. Wie die meisten durchgeführten Versuche zeigen, fehlt es an einer Erziehung des Zitierens, die nichts anderes als Berücksichtigung und Anerkennung der Arbeiten der Kollegen bedeuten würde.
f) Ein wichtiger Einwand gegen die Zitatenanalyse ist die absichtliche Weglassung von Zitaten aus Konkurrenzgründen.
In fast jedem Gebiet der Wissenschaft bilden sich häufig Gruppen von Wissenschaftlern, die einander konkurrieren und deshalb wenig, wenn nicht gar kein Interesse haben, die Ergebnisse oder Verdienste ihrer Konkurrenten zu verbreiten oder zu zitieren.
In seiner schon oben erwähnten Untersuchung über die Zitierungsgründe hat sich P. Vinkler auch mit den Gründen für die Auslassung eines Zitats beschäftigt. Er fand, daß Zitate aus folgenden Gründen ausgelassen werden:
- 10%, weil die Arbeit noch nicht bekannt war (in dieser Arbeit Grund a)
- 42 %, weil der Autor diese Arbeit nicht so wichtig fand
- 26 %, durch Eingemeindung (b)
- 6 %, weil das Dokument nicht verfügbar war (d)
- 6 %, weil das Dokument falsche Behauptungen beinhaltet
- 10 %, aus anderen Gründen.
In der Studie von Vinkler fehlt leider der Grund, nach dem eher der Review- Artikel eines bekannteren Wissenschaftlers bevorzugt wird. Dieses Ergebnis zeigt jedoch, daß  nur etwa 50% der Auslassungen korrekt waren. Gegen solche Vorkommnisse zeigt die Zitatenanalyse kein Rezept auf. Die Lösung dieses Problems kann nur von den Wissenschaftlern
3) Das Selbstzitieren
Zu einem gewissen Grade ist das Selbstzitieren gerechtfertigt, weil eine Veröffentlichung oft auf früheren Arbeiten des Verfassers beruht. Das Selbstzitieren kann aber die Anzahl der Zitate kaum wesentlich erhöhen, und so die bibliometrische Untersuchung verfälschen.
Außerdem wäre Ausschließen der Selbstzitate EDV-mäßig sehr leicht zu erreichen. Bei einer Online-Recherche würde der Befehl " Not Author = " genügen, um Selbstzitate ausscheiden zu lassen.
Schwieriger zeigt sich die Ausscheidung von Selbstzitaten bei Arbeiten, bei denen der Autor nicht als Erstgenannter aufscheint. Dieses Problem fällt aber schon unter:
4) Die Mehrverfasserschaft
Sie wurde schon bei der Verwendung der Anzahl der Veröffentlichungen als bibliometrischer Indikator als Schwierigkeit erwähnt. Sie kann auch die Interpretation von Zitatenanalysen beeinflussen, wie D. Lindseyin seiner Untersuchung gezeigt hat. Vor der Durchführung einer Zitatenanalyse über das Werk eines bestimmten Wissenschaftlers wird dessen Bibliographie benötigt, um seine Arbeiten mit anderen Autoren nachweisen zu können. Falls alle Arbeiten, bei denen er als Mitverfasser mitgewirkt hat, nachgewiesen wurden, wie kann sein eigener Verdienst bei jedem Beitrag eingeschätzt und angerechnet werden? Lindsey plädiert für die Einführung einer Korrektur für Mehrverfasserschaft. Solange der einzelne Beitrag jedes Mitwirkenden nicht herauszufinden ist, scheint ihm eine Teilung der Zitate durch die Anzahl der Autoren logisch.
5) Gefälligkeitszitierung oder willkürliche Schenkung von Zitaten
Aus Sympathie- oder Allianz gründen können Wissenschaftler einander in übertriebenen Verhältnissen zitieren. Diese Überzitierung ist das Gegenteil von der Auslassung von Zitaten aus Konkurrenzgründen (siehe 2)e)), und für sie gelten die gleichen Kommentare, wie sie schon im obigen Paragraphen diskutiert wurden.
6) Kritische und negative Zitate
Es wird häufig angenommen, daß kritische und negative Zitate eine Verfälschung der Zitatenanalyse zugunsten der "schlechten" Arbeiten bewirken könnten. Jedoch zeigt die Erfahrung, daß "schlechte Arbeiten" kaum zitiert werden. Die meisten Wissenschaftler finden keine Zeit, sich mit solchen Arbeiten zu beschäftigen oder ihnen Beachtung zu schenken. Kritische Zitate sind viel häufiger, haben aber auch bibliometrischen Wert. Kritisch zitierte Arbeiten waren für die zitierenden Autoren genügend wertvoll, um bestritten zu werden, vielleicht weil sie aus ihren Fehlern gelernt haben, oder ganz einfach als Referenz oder Vergleich benützt werden konnten.
7) Die Abhängigkeit vom Fachgebiet
Es wurde schon mehrmals signalisiert, daß die Zitatenanalyse sehr stark vom Fachgebiet abhängt. Zum Beispiel erhalten in der Biochemie Artikel  im Durchschnitt mehr als 30 Referenzen, in der Mathematik hingegen weniger als 10. Genauso wird in manchen Gebieten viel häufiger veröffentlicht als in anderen. In der Physik zum Beispiel enthalten die Arbeiten über Festkörperphysik viel weniger Zitate als jene über Kern- oder Hochenergiephysik; diese letzten sollen jedoch mehr organische Zitate als jene über Kern- und Festkörperphysik enthalten.
Das Altern der Literatur hängt auch vom Fachgebiet ab. Berücksichtigt man das Alter der zitierten Dokumente, findet man, daß ein großer Anteil der Zitate auf Literatur der letzten Jahre entfällt. Zum Beispiel beträgt die mittlere Halbwertszeit in der Physik 4.6 Jahre (d.h. die Hälfte der Referenzen in physikalischen Zeitschriften datieren von den 4.6 Jahren nach Erscheinen des Artikels), in der Chemie 8.1 Jahre. Diesen aus der Kernphysik stammenden Konzept der Halbwertszeit oder Halbleben, hat Price für die Einschätzung der sogenannten "Härte" einer Wissenschaft (engl. hard science) verwendet. Nach seiner Definition weisen große Halbwertszeiten auf wenig "harte", wenig "wissenschaftliche" Zeitschriften hin. Während z. B. in den physikalischen Zeitschriften 60% der Referenzen aus den ersten 5 Jahren stammen, sind es in der englischen Literatur nur 10% . Nach Price ist die Physik die "harte Wissenschaft par excellence" (sehr wissenschaftlich), während die englische Literatur eine "nicht so harte" ist.

Solche Unterscheidungen bewirken, daß die Wahrscheinlichkeit des Erhaltens eines Zitates vom Fachgebiet abhängt.  Interdisziplinäre  Zitatenanalyse sollte diese Tatsache nicht unbeachtet lassen.
8) Die Abhängigkeit vom Informationsträger.
Nicht alle Informationsträger werden gleich oft zitiert. So werden Zeitschriften und Bücher mehr zitiert als Reports, Tagungen, und "graue" Literatur. Selbst bei den Zeitschriften allein gibt es große Unterschiede, wie z. B.: die geographischen; so ist die Anzahl der Zitate in russischen Zeitschriften viel kleiner als in amerikanischen, europäischen oder japanischen. Dafür enthalten die amerikanischen Zeitschriften im Durchschnitt mehr organische Zitate als die russischen. Selbst bei den aus gleichem Landstammenden Zeitschriften gibt es welche, die viel häufiger gelesen werden, und deshalb eine größere Wahrscheinlichkeit des Erhaltens von Zitaten aufweisen.
Um den Impakt der Zeitschriften einschätzen zu können, wurde der sogenannte Impaktfaktor (engl. impact factor) einer Zeitschrift von E. Garfield eingeführt. Die Anzahl der Zitate, welche die Gesamtheit der Artikel einer wissenschaftlichen  Zeitschrift erhält, könnte schon als ein Indikator ihrer Benutzbarkeit betrachtet werden. Allerdings würden dann umfangreiche Zeitschriften  (Zeitschriften mit vielen Artikeln) von vornherein bevorzugt werden gegenüber solchen, die nur wenige Artikel enthalten, und häufig erscheinende Periodika gegenüber seltener erscheinendenAus diesem Grund wird die Anzahl der Zitate, die in einem bestimmten Zeitraum (üblicherweise ein Zitierungsjahr) auf die Artikel eines Journals aus einem davorliegenden Zeitraum (üblicherweise die beiden Jahre vor dem Zitierungsjahr) fallen, durch die Anzahl dieser Artikel dividiert. Dieser relative Wert wird "impact factor" genannt. Der "impact factor" selbst berücksichtigt nicht den Einfluß von Review-Artikeln.
Jährlich erscheinen in SCI/JCR die Listen der Impaktfaktoren der "wichtigsten" Zeitschriften.
Hier ist auch das nach Garfield benannte "Garfield's law of concentration" (Konzentrationsgesetz) zu berücksichtigen, das nichts anderes als eine Erweiterung des Bradfordschen Gesetzes ist, und nach dem eine relativ kleine Anzahl von Zeitschriften für die große Mehrheit der Veröffentlichungen in einem bestimmten Fachgebiet sorgt, eine überproportional große Zahl von Zitaten auf sich vereinigt und dadurch einen sehr hohen "Impact Factor" erhält. Dieser Konzentrationseffekt wird verwendet, um die sogenannten "Kernzeitschriften" eines Fachgebietes zu ermitteln.
Diese Tatsache würde Veröffentlichungen aus diesen "privilegierten" Zeitschriften bei Zitatenanalysen, wie zum Beispiel der Auswahl der "citation classics" sehr stark begünstigen. Um dieses Problem zu vermeiden, wird es in diesem Fall (Zeitschriften mit kleinem Impaktfaktor) die klassische Häufigkeitszitierungsgrenze auf  100 statt der üblichen 400 herabgesetzt.
9) Die Abhängigkeit von der Art der Arbeit.
Es wird behauptet, daß methodologische Arbeiten immer häufiger zitiert werden, während Theorien und Begriffe durch Eingemeindung im Vergleich weniger Zitate erhalten. Als Illustration dieser Tatsache wird immer die Arbeit von O.H. Lowry erwähnt, in der eine neue Methode zur quantitativen Eiweiß bestimmung dargelegt wird und welche einen Rekord an Zitate (mehr als 100.000 seit 1951) erhält. Der große Impakt dieser Arbeit bezieht sich nicht darauf, eine methodologische Arbeit zu sein, sondern eine neue Orientierung in diesem Gebiet eröffnet zu haben. Daß diese Arbeit mehr als z. B. die berühmte von Einstein zitiert wird, bedeutet aber sicher nicht, daß sie wichtiger ist. Diese Tatsache, am allerhäufigsten zitiert zu werden, drückt einfach aus, daß sich mit dieser Arbeit derzeit sehr viele Forscher befassen, und daß sich darin die aktuellen Interessen der wissenschaftlichen Gemeinschaft widerspiegeln. Eine  ungewöhnlich hohe Zitierungshäufigkeit einer bestimmten Arbeit könnte auch unter besonderen Bedingungen als Anomalie betrachtet werden.

Um diese Probleme (7, 8 und 9) zu vermeiden, schlagen Small & Sweeney den "fractional citation counting" vor. Bei der "Teilanzahl der Zitate" wird nicht die Summe der Zitate sondern deren Bruchteil als Referenz (d.h. 1 dividiert durch die Länge der Referenzliste) berücksichtigt. Erscheint das Zitat in einer Liste von 14 Referenzen, so beträgt dessen "fractional citation countig" nur 1/14.
(Beispiel)

Eine andere Möglichkeit, diese Probleme zu berücksichtigen, ist die Verwendung des sogenannten  "bibliometrischen Umfeldes" ("Environment of a scientific publication"). Dieses Umfeld bildet die für jede Analyse ausgewählte Sammlung von wissenschaftlichen Arbeiten, mit denen die betrachteten Arbeiten verglichen werden. Obwohl viele Methoden zur Definition dieses Umfelds vorgeschlagen wurden, hängt seine Auswahl sehr stark von Eigenschaft und Zweck der Studie ab.

Abschließend möchte ich folgende Worten von E. Garfield zitieren:
"...The citation is a precise, unambiguous representation of subject that requires no interpretation and is immune to changes in terminology. In addition, the citation will retains its precision over time. It also can be used in documents written in different languages.."

7. Zitaten als Retrievalmethoden
 

I. Kozitation oder  Zitatengruppenanalyse oder engl. Clusteranalysis
Diese Analyse  beruht auf zwei Hypothesen:
1) werden zwei Arbeiten von einer dritten gemeinsam zitiert, so gibt es eine kognitive Verknüpfung zwischen beiden, und

2) die Stärke dieser Verknüpfung wird von der Häufigkeit angegeben, mit der die beiden Zeitschriften zusammen zitiert werden.

(Garfield's Formel:  S = Co-citations of A+B / (Totalcitations A+B) -  (Co-citations of A+B))

Die Gruppe von Arbeiten, die mit einer bestimmten, festgelegten Häufigkeit gemeinsam zitiert werden, bildet ein Cluster. Das Konzept der Cluster oder Gruppen des gemeinsamen Zitierens wurde gleichzeitig von G. Small in Philadelphia und von I.W. Marschakowa in Moskau entwickelt (1973). So werden Cluster oder Verbindungen zwischen Clustern aufgebaut. Die Cluster beziehen sich auf Fächer oder Gebiete, ihre Verbindungen auf interdisziplinäre Beziehungen. Diese Analyse bietet die Möglichkeit, die Struktur der Fachgebiete und deren Beziehung zueinander zu erforschen, sowie die neuen Brennpunkte der Forschungsfronten zu identifizieren. Im "ISI-Atlas of science" wurden verschiedene Ebenen von Clustern verwendet, um "Vernetzungskarten" (engl. nested maps) aufzubauen (mapping science).

Diese Methode eignet sich gut für die Analyse der Struktur der Wissenschaft, kann aber nicht als "science policy" (Evaluation und Kontrolle der Wissenschaft) angewendet werden. Praktisches Beispiel von "Cocitation- und Clusteranalyse liefert das Verzeichnis ISR.
Sie zeigt den gleichen Nachteil wie alle Zitatenanalysen, und nämlich daß diese immer eine bestimmte Verzögerung mit sich tragen. Diese Verzögerung wird von der notwendigen Zitierungszeit angegeben.
Zitate sind ein "retrospektiver" bibliometrischer Indikator. Diese Verzögerung vermeidet aber die:

II. Bibliographische Kopplung  (engl. bibliographic coupling)
Dieser Terminus wurde von Kessler 1963 eingeführt. Zwei Dokumente sind bibliographisch gekoppelt, wenn ihre Referenzenlisten eine oder mehrere Arbeiten teilen. In der bibliographischen Kopplung werden jüngere Arbeiten verbunden, da sie gleiche ältere zitieren.  In der Clusteranalyse werden hingegen ältere Arbeiten verbunden, da sie später von jüngeren Arbeiten zusammen zitiert werden.
Die bibliographische Kopplung ist eine innere, statische Verbindung der
Dokumente, während die Clusteranalyse eine äußere,  dynamische ist.
Der Nachteil der bibliographischen Kopplung ist, daß sie subjektiver Art ist.
Die Beziehung zwischen den Dokumenten erfolgt nach den Angaben ihrer eigenen Autoren (die Referenzen werden vom Autor selbst angegeben).
Die bibliographische Kopplung wird im SCI unter dem Befehl "Related Records" (Themenverwandte Dokumente) verwirklicht.

8. DAS VERZEICHNIS DER VERZEICHNISSE: SCI

I. Der SCI als Datenquelle
Der SCI (SCIENCE CITATION INDEX: an international interdisciplinary index to the literature of science, medicine, agriculture, technology, and the behavioral and social sciences) wird von ISI (= Institute for Scientific Information, Philadelphia) seit 1963 herausgegeben (The scientist).
Als Vater dieses Verzeichnisses gilt der amerikanische Chemiker und Bibliothekar Eugen Garfield.

1960 gründete er das ISI für die Produktion und die Vermarktung des Current-awareness-Dienstes "Current Contents". Garfields größter Erfolg ist jedoch die Weiterentwicklung des in der Rechtsprechung bereits seit langem bekannten Zitierindexes, der "Shepards Citations", gedacht als Nachweis für Präzedenzfälle, die im amerikanischen Rechtssystem eine entscheidende Rolle spielen. Mit dessen Hilfe können alle juristische Entscheidungen, die auf einem bestimmten dokumentierten Fall aufbauen, ihn also zitieren, ermittelt werden.
Die Idee der inhaltlichen Erschließung und Kopplung von Dokumenten über Zitate wurde schon seit Mitte der fünfziger Jahre in den Vereinigten Staaten diskutiert.
Die Verweigerung staatlicher Unterstützung für die Publikation eines beim ISI entwickelten Pilotindexes bewog Garfield das Produkt unter dem Namen SCI ab 1963 selbst zu vermarkten. Damit wurde das Konzept der "Shepards Citations" auf den Bereich der Naturwissenschaften übertragen.
Dieses Verzeichnis ermöglicht sowohl eine Erschließung in Zeitrichtung (Source) als eine gegen die Zeitrichtung (Citation).
1998 erreichte der SCI einen Umfang von ca. 20 Millionen ausgewerteten Dokumenten ("source documents") und über 300 Millionen Zitaten  ("citations"). Damit ist er in seiner Größe einzigartig.
Seit 1973 wird der "Social Sciences Citation Index", seit 1978 der "Arts and Humanities Citation Index" herausgegeben.

II. Aufbau des interdisziplinären Verzeichnisses
Der SCI ist eine internationale Zeitschrifteninhaltsbibliographie mit fachlicher Beschränkung auf die Naturwissenschaft, Technik, Medizin und die Verhaltenswissenschaft. Er ist eine fachübergreifende Sammlung bibliographischer Daten aus Fachzeitschriften, die in gedruckter sowie maschinenlesbarer Form als Datenbank angeboten wird. Zum naturwissenschaftlich orientierten SCI kam 1973 der Social Science Citation Index (SSCI) (bis 1972 waren auch die Sozialwissenschaften einbezogen) und 1978 der Arts and Humanities Citation Index (A&HCI) dazu. Zur Erstellung wird zur Zeit insgesamt ein Kernsatz von zusammen 8000 Fachzeitschriften ausgewertet. Für die naturwissenschaftlichen Disziplinen einschließlich Medizin sind es rund 5300 Zeitschriften mit zur Zeit jährlich ca. 650.000 Veröffentlichungen und über 12 Millionen Zitierungen. Dieser Kernsatz umfaßt zwar nur etwa 10 Prozent der gegenwärtig weltweit periodisch erscheinenden wissenschaftlichen Zeitschriften, deckt damit aber mehr als 90 Prozent aller Zitierungen ab. Die Auswahl der Kernzeitschriften ist nicht statisch, sondern wird jährlich nach einer Reihe von Kriterien aktualisiert, wobei die Zitierhäufigkeiten eine wesentliche Rolle spielen.
Es scheint zunächst widersinnig, daß eine Datenbank, die selbst keine inhaltliche Wertung von Forschungsergebnissen vornimmt, trotzdem als Instrument für eine Bewertung geeignet sein kann. Doch es gibt ein wesentliches Merkmal, das den SCI von anderen Literatur-Datenbanken unterscheidet und ihn zugleich einmalig macht: In dieser Datenbank sind von jedem Originalartikel neben den bibliographischen Angaben (Titel, Autoren, Quelle) und dem Abstrakt (Inhaltskurzfassung) zusätzlich die Liste aller Literaturverweise (Referenzen) im Anhang der Publikationen gespeichert und suchbar. Dieser Referenzenteil ist sozusagen das Markenzeichen des SCI, der damit die Doppelfunktion einer Literatur- und einer Referenzen-Datenbank einnimmt. Dadurch ist es möglich, alle Veröffentlichungen zu finden, die eine bestimmte Publikation (oder die Publikationen eines Wissenschaftlers, eines Instituts oder eines Fachgebietes usw.) zitieren.

Dieser Index besteht aus folgenden Teilen:

1)  SOURCE INDEX: seit 1955 - (bald seit 1945!) enthält die zitierende Literatur:
Aufsätze aus ca. 3.300 Periodika aus allen Ländern in originalen Sprachen
Fachliche Beschränkung auf die Naturwissenschaft, Technik, Medizin und Verhaltenswissenschaft
Titelaufnahme:
Verfasser, Mitverfasser, Sachtitel (engl. + Originalsprache), Art des Beitrages (Letter, Note, Review), Quelle (Abkürzung), Band, Heft-Nr.,
Seitenangabe, Jahrgang, Anzahl der Referenzen, Anschrift des ersten Verfassers
+ Verzeichnung der Co-Autoren (Verw. auf 1.Verf.)
+ Referenzenliste
+ Abstrakt
Anhang: Aufsätze ohne Verfasserangabe (Titel der Zeitschrift)
+ Rezensionen aus 2 Zeitschriften: "Nature" und "Science"

2)  CITATION INDEX:
enthält die zitierte Literatur. Sämtliche in den Aufsätzen zitierte Schriften ohne Einschränkungen, aus allen Ländern, in allen Sprachen, aus allen Erscheinungsjahren, aus allen Schriftenklassen
Titelaufnahme:
Erst genannter Verfasser (NUR DER ERSTE), Erscheinungsjahr.- Jahr, Titel  oder Zeitschriftentitel (abgekürzt) (kein T. d. Aufsätze), Band, Seit

3) CORPORATE INDEX:
Register zum Source Index:
Titelaufnahme
Hauptteil:
"Geographic section": Institutionen, denen die Autoren d. Aufsätze des Source Index angehören
Nebenteil: "Organization section": Institutionen nach Namen, verweist auf "Geogr. Section"

4) PERMUTERM SUBJECT INDEX (PSI): 1965 -
Stichtwortregister "Permuterm" als Sach-Erschließung
List of full stop words
List of semi-stop words
(verweist auf d. 1. Verfasser.)

5) JCR - JOURNAL CITATION REPORTS (JCR):
A bibliometric analysis of science journals in the ISI database.
seit 1975: statistische Analyse der erschlossenen Zitierzusammenhänge + "ranking lists" (Rang nach verschiedenen Parametern)

Kumulierungen des Titelmaterials u. aller Register (Papierform):
jährlich + 5-Jahres-Kumulierung.
10-Jahres-Kumulierung.: 1955-64

Die Berichtszeiträume der vier Teile des SCI sind:
1) Source Index (Quellen-Index): ab  1955
2) Permuterm subject index: ab 1966
3) Citation index: ohne rückwärtige Grenze
4) Journal Citation Reports: ab 1975.

Seit 1973:   SSCI - Social Sciences Citation Index (Sozialwissenschaften)

Seit 1978: AHCI - Arts and Humanities Citation Index (Geisteswissenschaften)

III. Bibliometrische Indikatoren der JCR
Definitionen der verwendeten bibliometrischen Indikatoren:

1) Die Zitierrate (Total Citations): Zahl aller Zitate,   die auf eine bestimmte Zeitschrift oder ein bestimmtes  Dokument  im untersuchten Zeitperiode entfallen sind.

2) Impact Factor (Impaktfaktor): Anzahl d. Zitate / Anzahl d. Artikel
Anzahl d. Zitate = alle Zitate, die in dem Zitierungsjahr auf die Artikel des betrachteten Journals in einem bestimmten Zeitraum (die beiden Jahre vor dem Zitierungsjahr) entfallen sind / Anzahl d. Artikel in diesen zwei Jahren

Zwei Jahre werden als Zeitraum betrachtet. Garfield rechtfertigt dies damit, daß der durchschnittliche Artikel am häufigsten während der zwei Jahren nach seinem Erscheinungsjahr zitiert wird.

3) Immediacy Index (Unmittelbarkeitsfaktor):
Wie viele Artikel einer Zeitschrift noch innerhalb desselben Jahres zitiert worden sind; dabei wird die Anzahl der Zitate, die in diesem Jahr für Artikel aus dem gleichen Jahr gezählt wurden durch die Anzahl der in dieser Zeitschrift im gleichen Jahr  veröffentlichten Artikel  dividiert  (ist > 1, wenn einzelne  Artikel noch im selben Jahr mehrmals zitiert werden). Dieser Indikator soll ein Maß dafür sein, wie schnell der durchschnittliche Artikel einer bestimmten Zeitschrift zitiert  wird, d.h. mißt die Geschwindigkeit der Informationsverbreitung.

Zeitschriften,  die wichtige Informationen über neueste Forschungsarbeiten publizieren,  werden die Aufmerksamkeit der Wissenschaftler schneller auf sich ziehen.

4) Half-Life (Halbwertszeit):
Man spricht vom Altern der Information und in Analogie zum radioaktiven Zerfall auch von der Halbwertszeit wissenschaftlicher Literatur und meint damit die Zeit, nach der die Zitierungsrate auf die Hälfte ihres anfänglichen Wertes abgesunken ist. Die oben genannten Indikatoren benachteiligen Zeitschriften in Fachgebieten  mit großen Halbwertszeiten, da sie insgesamt  nur die drei aktuellsten Jahre berücksichtigen. Um für solche Zeitschriften größere Zeiträume einzubeziehen, werden "Citing Half-life" und "Cited Half-life" eingeführt. Citing Half-life  bezieht sich auf die Alterstruktur der Referenzen in einer Zeitschrift und bestimmt, vom aktuellen Jahr an rückwärts gerechnet, den Zeitraum,  in dem sich 50% aller Referenzen befinden (Zeit, von der die Hälfte der Referenzen einer Zeitschrift  in dem betrachteten Jahr stammen).

Cited Half-life bezieht sich auf die Altersstruktur der Zitate, die auf eine Zeitschrift entfallen und bezeichnet analog den Zeitraum,  in dem 50% aller Zitate liegen. Beide messen das Veralten (engl. "obsolescence") und die "Härte" (engl. "hardness") der Zeitschrift.

IV. Aufbau von JCR
Die Zitierdaten der untersuchten Zeitschriften werden dem Benutzer in folgenden  Abschnitten angeboten:

1. Abschnitt: "Journal Rankings"
Er dient als Überblick über die wichtigsten Daten und listet sie nach sechs verschiedenen Kriterien auf:
Liste 1 ordnet die Zeitschriften in alphabetischer Ordnung
Liste 2 ordnet die Daten nach Gesamtzitaten
Liste 3 nach Impact Factor
Liste 4 nach Inmediacy Index
Liste 5 nach der Anzahl der veröffentlichten Artikel
Liste 6 nach der Zahl der auf die beiden vorangegangenen Jahre entfallenen Zitate

2. Abschnitt: "Source data listing"
Er liefert eine Referenzenanalyse aller Quellenzeitschriften. Jeder Artikel wird nach Typ klassifiziert: Review oder Non-review Artikel. Als Review gilt ein Artikel, der mehr als 100 Referenzen oder das Wort "review" im Sachtitel oder in seiner Beschreibung enthält. Für jede Artikelklasse sowie für beide Klassen gemeinsam wird die Zahl der Artikel,  die Anzahl der darin erscheinenden Zitate und der Quotient aus diesen Werten bestimmt. Dieser Abschnitt beantwortet die Frage, ob und in welchem Umfang eine Zeitschrift Review-Artikel veröffentlicht.

3. Abschnitt: "Journal half-life listing"
Dieser Abschnitt bietet in drei Listen Informationen über Halbwertszeiten von Referenzen und Zitierungen von Zeitschriften.
Liste 1 listet für die zehn aktuellsten Jahre die kumulierten Prozentanteile an den Gesamtreferenzen auf. Daraus wird für jede Zeitschrift, die mindestens 100 mal in diesem Jahre zitiert worden sind, das Citing Half-life bestimmt.
Liste 2 listet die kumulierten Prozentanteile an den Gesamtzitierungen auf. Daraus wird, für jede Zeitschrift, das Cited Half-life bestimmt.
Liste 3 ordnet die Zeitschriften nach diesem Merkmal.

4. Abschnitt: "Subject category listing"
Er ordnet die ausgewerteten Zeitschriften einem oder mehreren Fachgebieten zu. Innerhalb der Gruppe werden die Zeitschriften nach deren Impact Factor gereiht. Das Cited Half-life wird auch angegeben.
Ein Register zu dieser Liste verzeichnet zu jeder Zeitschrift die ihr zugeordneten Fachgebiete.

5. Abschnitt: "Citing journal listing"
Für jede Zeitschrift erfolgen die Angaben, welche Zeitschriften und wie häufig sie zitiert hat.
(Folie 17)

6. Abschnitt: "Cited journal listing"
Für jede Zeitschrift erfolgen die Angaben, von welchen Zeitschriften und wie häufig sie zitiert wurde.

Zusätzlich werden alle verzeichneten Zeitschriften nach deren Abkürzung aufgelistet (List of the full titles of  citing/cited journals arranged alphabetically by abbreviation).
Die Abkürzung verweist auf den Volltitel. Titeländerungen werden auch alphabetisch verzeichnet (Journal Titel Changes)
 

V. SCI auf CD-ROM

Optionen der Search-Session:

Optionen der Vollanzeige:


 

Optionen der "Results" via "Toolbar":

Related Records and Parent Records


 

Anzeige der zitierten Dokumente:

Optionen bei Print/Save (alte CD-ROM Version)

VI. SCI online

Als Beispiele dienen folgende Online Recherchen in SCI:
1) Wie häufig wird Prof. Hans-Peter Karnthaler zitiert?
2) Wie häufig wird Albert Einstein zitiert?

VII. SCI im Internet

SCI ist im Internet unter "Web of Science" zu finden:

Web of Science*:
The Web of Science (WoS) provides access to over 22 Million bibliographic records covering all fields of research from the past 25 years. It includes the Science Citation Index Expanded, the Social Sciences Citation Index and the Arts & Humanities Citation Index.
JCR : Journal Citation Reports* :
The two editions of the JCR provide citation data (e.g. journal impact factors) of nearly 5.000 science journals and 1,700 social sciences journals.

Essential Science Indicators (ESI)
ESI was updated on January 1, 2003 to cover ten years plus ten months, January 1992 - October 31, 2002



provides internet access to a unique and comprehensive compilation of essential science performance statistics and science trends data derived from ISI's databases. The chief indicators of output, or productivity, are journal article publication counts. For influence and impact measures, ESI employs both total citation counts and cites per paper scores. The former reveals gross influence while the latter shows weighted influence, also called impact.

Unter Citation Rankings: Scientists kann man finden, wie häufig ein bestimmter Forscher zitiert wird.

Ein Vergleich mit anderen Forschern aus gleichem Gebiet wird auch angeboten:



Unter Citation Rankings: Institutions kann man finden, wie häufig eine bestimmte Körperschaft zitiert wird:


Ein Vergleich mit anderen Institutionen aus gleichem Gebiet (z. B. Materials Science) wird auch angeboten:

Unter Citation Rankings: Countries ist die gleiche bibliometrische Analyse für ein bestimmtes Land zu finden:

a) citations per paper:



b) Gesamtanzahl der Citations:


Unter Most Cited Papers: Highly Cited Papers (last 10 years) kann man die in den letzten zehn Jahren am meistens zitierten Arbeiten:

entweder nach dem Gebiet (Physics)

oder nach dem Land (Austria) oder Institution:



Unter Most Cited Papers: Hot Papers (last 2 years) ist die gleiche Bibliometrische Analyse innerhalb der letzten zwei Jahren zu finden:

Unter Citation Analysis Research - Baselines sind zwei andere bibliometrische Analysen zu benützen:

Unter Average Citation Rates wird die mittlere Zitierhäufigkeit je nach dem Fach errechnet (ein Paradebeispiel für die Abhängigkeit der Impaktfaktoren vom Fachgebiet):

Unter Percentiles wird die Anzahl der Zitate verstanden, die eine Arbeit in einem bestimmnten Fachgebiet benötigen wurde, um 0,01, 0,10 oder 1,00 oder 10% der Gesamtzitate in diesem Gebiet zu erhalten.

Die Percentiles werden hier errechnet und zeigen, wie sich die Zitierhäufigkeit in einem bestimmnten Fachgebiet innerhalb der letzten zehn Jahren entwickelt hat:

To read this table:
The Percentiles page is divided into sections for each individual scientific field, with the "All Fields" section combining all data. Within each section are rows for the four percentile breakdowns (0.01%, 0.1%, 1%, and 10%). Data for the percentiles are given for the last 10 years, with the "All Years" column using all data for those years.
See the picture above. In the Chemistry portion of the table, a value of 66, for instance, in the 0.01% column for 1998 indicates that the top 0.01% of papers in chemistry journals in that year have since been cited a minimum of 66 times.

Unter Citation Analysis Research Fronts werden die Research Fronts ("current articles can be organized into subject areas according to the clusters of older papers that they cite in common") identifiziert:


Die können nach deren Namen oder innerhalb eines Fachgebietes gesucht werden:


Hinweise:
Ganz angenehm sind die zahlreichen Optionen, die das Sortieren der Ergebnisse nach verschiedenen Kriterien ermöglichen.
In dem Teil Citation fällt außerdem die Einschränkung "nur erster Autor" aus,  allerdings nur für diese Arbeiten, die in dem Source Teil verzeichnet werden.

VIII. Kritik und Problematik

Allgemeine Kritik an SCI und an JCR:

1) Umfang des Datenmaterials:

2) Probleme der Zuverlässigkeit bei der Sammlung und Verarbeitung der JCR-Daten

3) Auswahlpolitik für auszuwertende Zeitschriften

4) Fehler bei der Verarbeitung der Zitierdaten

5) Die JCR-Daten sind nicht repräsentativ genug

6) Korrelation von Zitierfrequenzen aus Zitatenanalysen und Benutzungsfrequenzen in Bibliotheken ist nicht  so hoch wie erwartet

Kritik an "Impact Factor":

1) Kritik am Zeitraum der ausgewerteten Daten (aus den beiden letzten Jahren)
2) Kritik am Umfang der auszuwertenden und ausgewerteten Daten
3) Kritik an der Qualität der ausgewerteten Daten (Selbstzitate!, Titeländerungen)
4) Mißverständnisse bei der Interpretation
5) Einfluß auf die Verlage und die Publikationsformen
("E. Garfield beherrscht mit absolutistischer Macht die wissenschaftliche Szene. Editors und Verleger von Journals, die zitiert werden wollen, geben sich in Philadelphia die Klinke in die Hand", Lindner)
 

Praktische Nachteile von SCI:

1) Nur erster Autor wird zitiert!
2) Formale Fehler (Computer-generiertes Verzeichnis)
Sie können von den Autoren der Originaltexte verursacht oder während der verlegerischen Produktion entstanden sein. Diese Fehler sind in Abhängigkeit vom Arbeitsaufwand zum Teil korrigierbar (ca. 1% aller Bandangaben sind fehlerhaft), Mangel an Konsequenz!
3) Probleme mit Homographen (Autoren mit gleichem Namen)
4) teuer
 

9. Präsentation der Ergebnisse
Folgende Beispiele dienen als Muster:
a) Auswirkung einer individuellen Arbeit
b) Eminenz eines bestimmten Forschers:  Beispiel 1   und Beispiel 2
c) Prestige und Leistung einer bestimmten  Forschungsanstalt, (by citation impact oder by  total citations), einer Firma oder eines Landes,
d) Internationale Vergleiche für ein bestimmtes Fachgebiet
e) Bei Zitatenanalysen von Zeitschriften werden die Zitierfrequenzen aller in einer Zeitschrift enthaltenen Artikel summiert und die Summe als Maß für den Wert der Zeitschrift angesehen. Die Auflistung nach verschiedenen Kriterien ist die einfachste Art der Präsentation. Paradebeispiele liefern die Ranking-Listen der JCR. Unter Einsatz der elektronischen Datenverarbeitung sind auch mehrdimensionale Darstellungsarten  entwickelt worden.
Besondere Beachtung finden die sogenannten  "one-stepmaps" bzw. "two-step maps", bei denen jeweils diejenige Zeitschrift B bestimmt wird, die von einer Zeitschrift A am häufigsten und bzw. am zweithäufigsten zitiert wird. Dabei werden Selbstzitate, d.h. Zitate anderer Artikel der gleichen Zeitschrift nicht berücksichtigt. Bei der Einbeziehung einer definierten Menge von Zeitschriften entsteht ein Netzwerk, in dem die Zuordnung "A zitiert am häufigsten B" durch einen Pfeil repräsentiert wird.

Eine andere sehr gebrauchte Darstellungsmethode ist die Cluster-Analyse, nach der Zeitschriften, die sich gegenseitig häufig zitieren als andere, eine inhaltliche  zusammenhängende Gruppe bzw. einen Cluster bilden.
Der Informationswert der Cluster-Analyse basiert auf der Verarbeitung einen großen Menge von elektronisch gespeicherten Zitierdaten und eines ausgefeilten Iterationsprozesses (Software). Wegen  ihres riesigen operationalen Aufwandes wird diese Methode meistens nur bei Untersuchungen in der Wissenschaftskunde verwendet.

10. Kommentare

"By citing other works, authors create footprints in the landscape of scholarly achievement".
Diese "Spuren" sind die wichtigsten Instrumente, die uns für das Studium der Entwicklung und Struktur der Wissenschaft zur Verfügung stehen. Obwohl die Häufigkeit des Zitierens einer Arbeit nichts Endgültiges über ihre Qualität, jedoch über ihre Auswirkung aussagt, kann man mit großer Wahrscheinlichkeit behaupten, daß eine häufig zitierte Arbeit, ein wichtiges, wissenschaftliches Ergebnis enthält, oder daß sie, nach den Worten von Cronin, eine tiefe Spur hinterlassen hat.

Die Einführung der Zitate als Bewertungsmethode des Impakts einer Arbeit hat die aktuelle "Veröffentlichungskrankheit" entlarvt: Mehr als ein Drittel dieser Arbeiten werden nicht einmal zitiert. Würden zusätzlich die Selbstzitate betrachtet, stiege diese Zahl dramatisch.
Mehrere Untersuchungen von E. Garfield zeigen, daß die mittlere Zitatenjahresquote von zitierten Veröffentlichungen bei etwa 1,7 liegt oder daß die festgelegte Schwelle der für diese Quote, die bei 15 bis 17 Zitaten liegt, von weniger als 1 Prozent der im "Science Citation Index" verzeichneten Arbeiten überschritten wird.
Nur extrem wenige Veröffentlichungen werden oft zitiert (z.B. mehr als 100 mal) und sehr viele nur selten (1-10 mal) oder überhaupt nicht. Eine solche unsymmetrische Verteilung wird in Anlehnung an die Untersuchungen über die Verteilung von Einkommen von V. Pareto zu Ende des vorigen Jahrhunderts als Pareto-Verteilung bezeichnet. Fast 50 Prozent aller vom SCIENCE CITATION INDEX erfaßten Veröffentlichungen aus dem Zeitraum 1981-1985 wurden im Zeitraum von 5 Jahren nach ihrem Erscheinen kein einziges Mal von anderen Autoren zitiert. Der Anteil der mehr als einmal zitierten Publikationen wurde auf nur 20 Prozent abgeschätzt. Dazu muß einschränkend bemerkt werden, daß 1/4 der erfaßten Veröffentlichungen Kurzmitteilungen sind, die in der Regel nicht zitiert werden. Für den Bereich der Naturwissenschaften allein und bei Nichtberücksichtigung der Kurzmitteilungen beträgt der Anteil der nicht
zitierten Veröffentlichungen immerhin noch 23 Prozent (aus einer Zitierungsanalyse der Veröffentlichungen in 1984 und deren Zitierungen bis Ende 1988).

Natürlich gibt es auch Kontroverse über die Gültigkeit dieser Methode und ihre richtige Anwendung und Interpretation. Keine Bewertungsmethode kann aber durchaus objektiv und perfekt sein. Es werden sicher immer einzelne Fälle von Benachteiligungen auftreten, es wird auch sicher immer sehr gute Veröffentlichungen geben, deren Bedeutung und Qualität erst viele Jahre nach ihrem Erscheinen, wenn überhaupt, anerkannt werden.
Solche bibliometrischen Untersuchungen können aber zweifellos einer besseren Orientierung und Beurteilung der wissenschaftlichen Leistung von konkreten Forschern und Forschungsanstalten dienen. Die erfolgreiche Durchführung solcher Analysen setzt aber gute Kenntnisse über diese Methode, deren Schwäche, Mängel und Einschränkungen voraus. Fehlplanungen und -urteilen sind sehr gefährlich, wenn man betrachtet, von welch großer Bedeutung die Interpretation der Ergebnisse sein kann.

11. Literatur

1. Gorraiz, J.: "Die unerträgliche Bedeutung der Zitate".
    In: Biblos. Jg. 41 (1992), H. 4, S.193-204.

2. Lawani, S.M.: Bibliometrics: Its Theoretical Foundations, Methods and Applications.
    In: Libri. Copenhagen. Jg. 31 (1981), S. 294-315.

3. Pritchard, A.: Statistical Bibliography or Bibliometrics?
    In: Journal of Documentation. London. Jg. 25 (1969), H. 4, S. 348-349.

4. Garfield, E.: Is citation analysis a legitime evaluation tool?
  In: Scientometrics. Amsterdam.   Jg. 1 (1979),   S. 359-375.

5. Garfield, E.: In Tribute to Derek John de Solla Price: A Citation Analysis of Little Science, Big Science.
  In: Scientometrics.  Amsterdam. Jg. 7 (1985), H. 3-6, S. 487-503.

6. Vinkler, P.: A quasi-quantitative citation model.
  In: Scientometrics. Amsterdam. Jg. 12 (1987),  H. 1-2, S. 47-72.

7. Schlögl, Christian: "Gefahren und Nutzen von bibliometrischen Untersuchungen am Beispiel Informationsmanagement", 26. Österreichischer Bibliothekartag  "Produktionsfaktor Wissen", UniversitätsCampus Wien, 19. - 23. September 2000

8. Werner Marx und Gerhard Gramm: Wächst der Wissenschaft das Wissen über den Kopf?

Elektronische Dokumente zum Thema Bibliometrie, Scientometrie

Benjamin F. Bowman, Werner Marx, Urs Schoepflin:
Anmerkungen zum Einsatz von Zitierungsanalysen für die Forschungsevaluation

Werner Marx, Hermann Schier, Michael Wanitschek:
Kann man Forschungsqualität messen? .
(erschienen im MPG-Spiegel 3/1998)
(Zitierungszahlen als Maß für Resonanz  auf wissenschaftliche Aktivität)

Teresa Y. Neely:
The Impact of Electronic Publications on Promotion and Tenure Decisions
(über Bedeutung elektronischer Veröffentlichungen für bibliothekarische Karrieren, primär in wissenschaftlichen Bibliotheken der USA , Oktober 1999)

Tobias Opthof *
Sense and nonsense about the impact factor