SZIENTOMETRIE : Zitatenanalyse
1. Einführung
2. Kurze Geschichte
3. Begriffe
4. Zitatenanalyse
5. Anwendungen
6. Evaluative bibliometrische Verfahren:
I.
Die sogenannte "Peer Review" Methode
II. Anzahl der Veröffentlichungen
III. Zitatenanalyse:
Problematik
7. Zitate als Retrievalsmethode
I. Zitatengruppen-
oder Clusteranalyse
II. Bibliographische
Kopplung
8. Das Verzeichnis der Verzeichnisse:
SCI
I. Der SCI als Datenquelle
II. Aufbau des Verzeichnisses
III. Bibliometrische Indikatoren
der JCR
IV. Aufbau von JCR
V. SCI auf CD-ROM
VI. SCI online
VII.
SCI im Internet
VIII. Kritik und
Problematik
9. Präsentation der Ergebnisse
10. Kommentare
11. Literatur
1. Einführung
Wie misst man Wissenschaft und wissenschaftliche Produktion?
Unter Informetrie versteht man die Anwendung mathematischer Methoden auf die
Sachverhalte des Informationswesens. Sie ist eine Disziplin im Überscheidungsbereich
zwischen Mathematik und Informationswissenschaft. Die Informetrie wird auch
Bibliometrie oder Szientometrie genannt.
Der Begriff "Bibliometrie" wurde 1969 von A. Pritchard geprägt. Zweck
und Definition der Bibliometrie ist die Anwendung mathematischer und statistischer
Methoden zur Erklärung der Prozesse der schriftlichen Mitteilungen, sowie
der Natur und des Entwicklungskurses eines Wissenschaftsgebietes, durch Zählung
und Analyse der verschiedenen Aspekte der schriftlichen Kommunikation.
Derzeit hat sich die Bibliometrie als die bedeutendste
Methode für die Bewertung wissenschaftlicher Arbeiten erwiesen.
Sie ist die Metrik des Buchwesens und untersucht unter Einsatz mathematisch-statistischer
Methoden die quantitativen Regelhaftigkeiten von Printmedien im Informationsstrom
in Beziehung zur Wissenschaftstheorie und Forschung.
Eine modernere Definition von Hawkins lautet: "Quantitative
Analyse der bibliographischen Aspekte eines Literaturthemas". Diese Definition
hat den Vorteil, daß sie den quantitativen
Aspekt dieser Wissenschaft
hervorhebt.
Die Zitatenanalyse ist ein Gebiet der Bibliometrie, das sich mit dem Studium der Beziehungen zwischen zitierten und zitierenden Arbeiten und ihrer Anwendung als bibliometrische Untersuchungsmethode beschäftigt. Als bibliometrischen Parameter verwendet die Zitatenanalyse die Zählung der auf eine bestimmte Arbeit, ein bestimmtes Dokument oder einen bestimmten Verfasser entfallenden Zitate. Je größer die Zitierhäufigkeit ist, desto höher wird ihr Wert veranschlagt.
2. Kurze Geschichte
Die erste bibliometrische Untersuchung erschien 1917 und war eine von
Cole und Eales verfaßte Veröffentlichung einer statistischen
Analyse der Literatur über Anatomie in dem Zeitabschnitt zwischen
1550 und 1860, um die Schwankungen des Interesses in dieser Disziplin zu
zeigen. P. Gross und E. Gross waren 1927 die ersten, die Zitate als
bibliometrische Datenquellen verwendeten. Sie zählten und analysierten
die in den einzelnen Artikeln einer chemischen Zeitschrift angeführten
Zitate, und kamen zu einer Liste von Zeitschriften die sie als unentbehrlich
für die chemische Ausbildung betrachteten.
1966 war in der Sowjetunion das Buch "Nauka o nauke" von G.M. Dobrov
mit dem Untertitel "Vvedeniev obscee naukoznanie" erschienen. 1969 wurde
diese Veröffentlichung als "Wissenschaftswissenschaft" zum ersten
Male in deutscher Sprache herausgegeben. Nach Dobrov ist die Wissenschafts-wissenschaft
die komplexe Untersuchung und Verallgemeinerung des Funktionierens wissenschaftlicher
Systeme mit dem Ziel, das Potential der Wissenschaft zu verstärken
und die Effizienz des wissenschaftlichen Prozesses mit Hilfe organisatorischer
Mittel zu erhöhen.
Einige Monate früher als Pritchard hatten Nalimov und Mul'cenko,
ebenfalls Russen, den Begriff
Szientometrie oder Wissenschaftsmetrie
(auf russisch "naukometrija") eingeführt. Nach ihrer Definition ist
die Szientometrie (engl. scientometrics) die Anwendung quantitativer Methoden
auf das Studium der Geschichte der Wissenschaft als Informationsprozeß.
Ein anderer Terminus, der auch häufig (stammt aus der DDR) verwendet
wird, ist die Informetrie. Dieser Terminus wurde von Blackert und
Siegel eingeführt, da viele Arbeiten, die gegenwärtig als
bibliometrische gestempelt werden, nicht dem Zweck dienen, einen Beitrag
zur Bibliothekswissenschaft zu leisten. Um ihre Beziehung zur Informatik
zu betonen, wird dieses Fachgebiet Informetrie benannt und definiert als
die Lehre der Anwendung mathematischer Methoden auf die Sachverhalte des
Informationswesens zur Beschreibung und Analyse ihrer Phänomene, zum
Auffinden ihrer Gesetze und zur Unterstützung ihrer Entscheidungen.
Informetrie, Szientometrie und Bibliometrie überschneiden
sich. Die Verwendung des einen oder anderen Terminus
hängt sehr stark davon ab, welcher Aspekt, der bibliothekarische,
der wissenschaftliche oder der informatische, herauszuheben
ist, deshalb wird in dieser Arbeit von Bibliometrie
gesprochen.
Seitdem hat diese Art von Untersuchungen ständig mehr Anhänger
gefunden. 1969 zählte Pritchard schon über 700 Items. Heute gibt
es Zeitschriften, die sich nur mit diesem Thema beschäftigen, wie
z.B. Scientometrics, eine Zeitschrift die seit 1978 besteht. Eine vom Autor
selbst durchgeführte Literaturrecherche in der Datenbank LISA (Library
and Information Science Abstracts) nach dem freien Suchbegriff "scientometric?
or bibliometric?" ergab schon Anfang 1990 1262 Treffer, von denen sich
508 mit Zitatenanalyse beschäftigen.
Derzeit existiert sogar eine International Society for Scientometrics and Informetrics
ISSI, die regelmäßig
Tagungen organisiert.
3. Begriffe
Sehr wichtig ist der Unterschied zwischen Zitat (engl.
citation) und Referenz (engl. reference).
Formale Aufbau einer wissenschaftlichen Veröffentlichung (engl. paper)
zeigt eine standardisierte Struktur:
Titel, Autoren, Anschriften (Affiliation, Corporation), Abstrakt, Deskriptoren,
Fulltext, Referenzen.
Ein Bestandteil ist die Aufführung der Forschungsergebnisse, auf denen
die Arbeit aufbaut. Es wird verlangt, daß der Autor die Verwendung bereits
bekannter Methoden oder Resultate zitiert, die zu seiner Arbeit in enger inhaltlicher
Beziehung stehen. Die Angabe der Zitate erfolgt in der Form eines vereinheitlichten
kurzen Hinweises auf das zitierte Dokument und hängt sehr stark vom zitierenden
Verfasser sowie von der Quelle ab, denn jede Zeitschrift oder Datenquelle verwendet
besondere Regeln oder Empfehlungen zur Darstellung der Referenzen (Notes
for Contributors, Instructions for Authors).
Ebenso kann die Plazierung der Referenzen im Text unterschiedlich sein. Sie
können in den fortlaufenden Text eingebettet sein, in einer Fußnote
erscheinen, oder meistens in Form einer Literaturliste am Schluß der Veröffentlichung
präsentiert werden.
Definition:
Enthält die Veröffentlichung X eine bibliographische Note, in der
die Veröffentlichung Y beschrieben oder verwendet wird, dann enthält
X (citing document) eine Referenz zu Y, und bekommt Y (cited document)
ein Zitat von X.
4. Zitatenanalyse
Die Zitatenanalyse beschäftigt sich mit dem Studium der
Beziehungen zwischen zitierten und zitierenden Arbeiten und ihrer Anwendung
als Untersuchungsmethode. Sie zeigt, welchen Einfluß die betrachtete Arbeit
auf die wissenschaftliche Gemeinschaft hat. Sie mißt den "Nutzen"
(Auswirkung, Resonanz, Rezeption, Impakt, üblich ist der englischsprachige
Terminus technicus "Impact"), den diese Arbeit für andere Wissenschaftler
hat oder gehabt hat, sagt aber nichts Endgültiges über ihre Qualität
aus. Es ist jedoch sehr wahrscheinlich, daß eine häufig zitierte
Arbeit wichtige Informationen enthält.
Zitatenanalyse bezeichnet die Auswertung von Zitaten im Rahmen einer empirischen
Untersuchung. Als bibliometrische Quellen stehen die zitierten und die zitierenden
Arbeiten. Diese Daten werden aus besonderen Verzeichnissen
wie z. B. "Science Citation Index" gewonnen, die von den sogenannten
"counting houses" angeboten werden.
Zitatenanalyse können auf verschiedenen Stufen der Komplexität vorgenommen
werden. Auf der untersten Stufe kann ein einzelnes Dokument, ein
Zeitschriftenartikel, Buch oder graue Literatur die Einheit der Analyse
sein. Dadurch kann die Frage beantwortet werden, wie oft, wann und von wem das
Dokument zitiert worden ist. Auf der nächsten Stufe können alle Veröffentlichungen
eines oder mehrerer Autoren, von Körperschaften oder Zeitschriften untersucht
werden. Schließlich sind Studien über Universitäten oder
alle aus einem Staat stammenden Veröffentlichungen sowie über Eigenschaften
und Entwicklung bestimmter Wissensgebiete möglich.
5. Anwendungen
Unter den wichtigsten bibliometrischen Anwendungen der
Zitatenanalyse sind folgende zu erwähnen:
1) Auswahl von Monographien und Zeitschriften in
der bibliothekarischen Erwerbung
Ein sehr wichtiges Kriterium für die Erwerbung von Monographien
und Zeitschriften, vor allem in Fachbibliotheken, liefert deren Zitierungshäufigkeit,
wie zahlreiche Untersuchungen dieser Art illustrieren. Zu diesem
Zweck wurde von E. Garfield der sogenannte "Impact
Factor" eingeführt, von dem später gesprochen wird.
2) Auswertungen von Sammlungen und Bibliographien
Diese Auswertungsmethoden beruhen vor allem auf der Möglichkeit,
"ranking lists" (Ranglisten) aufzustellen. Ranglisten werden auch nach
verschiedenen bibliometrischen Indikatoren erstellt (Beispiele sind
bei der Beschreibung vom SCI-JCR zu finden). Die
gebräuchlichsten Ranglisten sind jene, die nach der Anzahl der erhaltenen
Zitate aufgebaut werden. Solche Listen werden jedoch mehr für die
Auswahl als für die Auswertung von Sammlungen verwendet.
3) Untersuchung der Merkmale von Fachliteraturen
Eines der am meisten untersuchten Merkmale einer Fachliteratur
ist das sogenannte "Veralten" (engl. obsolescence).
Unter Veralten wird der Verfall mit der Zeit der Gültigkeit und Benutzbarkeit
der Information verstanden. Dies ist sehr wichtig für die Bibliothekare,
die ständig wachsende Sammlungen in beschränkten Räumen
führen. Die Einschätzung des Alterns einer Literatur wird gewöhnlich
durch die Verminderung der Zitate mit der Zeit angegeben.
Dafür wurde von Brookes der bibliometrische Indikator,
das Halbleben oder Halbwertszeit (engl. half life),
eingeführt, der später ausführlicher erörtert wird.
Diese Untersuchungen können bei Klärung folgenden Fragen
helfen:
ob eine Zeitschrift rückwärtig ergänzt werden sollte, ob
und welcher Teil einer Zeitschrift magaziniert oder makuliert werden könnte
und ob und wann eine Zeitschrift gebunden werden sollte.
Als Instrument für den Bestandsaufbau bei Zeitschriften in wissenschaftlichen
Bibliotheken könnte sie die Objektivität von Entscheidungen vergrößern,
da sie unabhängig von den Einflußnahmen von Benutzergruppen
getroffen werden könnten.
4) Historische und soziologische Anwendungen.
Garfield und seine Mitarbeiter vom ISI (Institute for Scientific Information)
haben bewiesen, daß:
a) Zitate eine wichtige Rolle beim Studium der Geschichte der Wissenschaften
spielen können,
b) eine graphische Darstellung (genannt "Historiograph") eine
schnelle Übersicht über die Entwicklung einer bestimmten Disziplin
oder deren Entwicklung in einem Land ergeben kann,
c) solche graphische Darstellungen in der Praxis problemlos zu erhalten
sind.
Darunter zählt auch die Ermittlung der "klassisch zitierten" Arbeiten
(engl. "citation classics") einer bestimmten Disziplin.
Solche Arbeiten werden mit einer größeren Häufigkeit
innerhalb eines Fachgebietes zitiert. Die Festlegung des "klassischen"
Niveaus zeigt sich aber nicht so einfach. So kann eine absolute Häufigkeit
nicht angenommen werden, da in diesem Fall fast nur Artikel von bestimmten
Zeitschriften (jenen mit sehr hohem Impaktfaktor, d.h. Zeitschriften die
selbst viel häufiger als alle anderen zitiert werden) "citation classics"
wären. Listen von "citation classics" erscheinen regelmäßig
in der Zeitschrift "Current contents".
5) Andere evaluative bibliometrische Untersuchungen.
Diese Anwendungen umfassen auch die Einschätzung
:
a) der Auswirkung einer individuellen Arbeit ,
b) der Eminenz eines bestimmten Forschers ,
und
c) des Prestiges und der Leistung einer bestimmten Forschungsanstalt
, Firma oder eines Landes.
Zitatenanalyse ist heute eine der wichtigsten Methoden der akademischen Evaluation.
6. Evaluative bibliometrische Verfahren
I. Die sogenannte "Peer Review"
Methode
Diese Methode verwendet seit mehr als 35 Jahren die National Science
Foundation der USA zur Entscheidung, welche Wissenschaftler Forschungsanträge
zur Förderung der Wissenschaften erhalten, und dient heutzutage zum
gleichen Zweck in den meisten europäischen Ländern, inklusive
Österreich. Sie funktioniert auf folgende Weise:
Zuerst verfaßt der Kandidat ein schriftliches Ansuchen, in dem
er seine frühere Tätigkeit, seine Qualifikationen und seine geplante
Forschungsarbeit beschreibt. Dieses Ansuchen erhält der sogenannte
Programm-Direktor. Dieser bestimmt, welchem Fachgebiet die vorgeschlagene
Arbeit angehört, und wählt dann eine Anzahl von Referenten (Fachleute
in diesem Gebiet), die befragt werden, ob der Vorschlag als ausgezeichnet,
sehr gut, gut, annehmbar oder schlecht bewertet wird. Aufgrund dieser Bewertungen
trifft der Programm-Direktor eine Entscheidung.
Die häufigste Kritik an dieser Methode ist die sogenannte "old
boy" (alte Freunde) Hypothese, nach der eine Clique von eminenten
Wissenschaftlern begünstigt wird. So würden die Entscheidungen
des Programm-Direktors stärker von dem Antragsteller selbst als von
seiner vorgeschlagenen Arbeit abhängen.
Diese Methode wird aber nicht zur Einschätzung der Auswirkung
einer wissenschaftlichen Arbeit oder der Verdienste eines Wissenschaftlers
verwendet, da die für ein objektives Ergebnis benötigte
Anzahl der Referenten sehr groß und deswegen unrealistisch wäre.
II. Anzahl der Veröffentlichungen
Hingegen fügt heutzutage jeder Wissenschaftler seinem Lebenslauf
eine Liste seiner Veröffentlichungen, vor allem bei Bewerbungen und
Preisausschreiben, bei, um seine Verdienste zu dokumentieren. Die Anzahl
der Veröffentlichungen ist der einfachste und bekannteste Indikator.
Sie stellt das Gesamtvolumen der Forschungsproduktivität dar,
ist aber quantitativer Natur und gibt kaum Information über die Auswirkung
und Qualität dieser Arbeiten.
Erhält der Herausgeber einer wissenschaftlichen Zeitschrift ein
Manuskript zur Veröffentlichung, so wählt er qualifizierte Referenten
aus, die um ihre Fachmeinung befragt werden. Dem Autor bleibt die Identität
der Referenten seiner Arbeit unbekannt, leider und unverständlicherweise
wird aber bei Veröffentlichungen in den meisten Zeitschriften den
Referenten die Identität des Verfassers der Arbeit nicht verschwiegen,
was sehr leicht zu einer subjektiven Meinungsbildung führen kann.
Dies ist der Grund, warum es junge, noch unbekannte Wissenschaftler
viel schwieriger als schon etablierte haben, ihre Ergebnisse zu veröffentlichen.
Obwohl die Veröffentlichung in einer wissenschaftlichen Zeitschrift
bestimmten Qualitätsanforderungen obliegt, sind diese aber von einer
Zeitschrift zur anderen sehr unterschiedlich und daher nicht vergleichbar.
Außerdem weist dieser Parameter viele Nachteile auf, von denen
zu erwähnen sind:
a) Die Wiederveröffentlichung derselben Arbeit in verschiedenen
Versionen in mehreren Zeitschriften:
Daß nur die Anzahl der veröffentlichten Arbeiten als Indikator
verwendet wird, kann dazu führen, daß eine Arbeit mehrmals oder
in mehreren Teilen veröffentlicht wird, um den Wert dieses Parameters
zu erhöhen. Dies beeinträchtigt dessen bibliometrische Aussage.
b) Auch die ständig wachsende Anzahl der Arbeiten, die von mehreren
Autoren verfaßt werden, kann die Analyse verfälschen, da nicht
immer alle Verfasser im gleichen Ausmaß beigetragen haben, oder,
was häufig der Fall ist, eine Co-Autorschaft willkürlich
angegeben wird.
Trotz dieser Einwände wird dieser Indikator noch heute verwendet,
und dient der Erstellung anderer, besserer bibliometrischer Parameter.
Nachteil: Die Subjektivität und Willkürlichkeit der Herausgeber
wissenschaftlicher Zeitschriften bei der Auswahl von den zu veröffentlichen
Arbeiten.
III. Zitatenanalyse
In diesem Falle ist der einfachste Indikator die bloße
Anzahl der Zitate. Wie E. Garfield ganz klar
formuliert, zeigt dieser Indikator, welche Auswirkung eine konkrete
Arbeit auf die wissenschaftliche Gemeinschaft hat; sie
mißt den Nutzen (engl. "impact"), den diese Arbeit
für andere Wissenschaftler hat, denn das Zitieren
in einer wissenschaftlichen Publikation bedeutet die Anerkennung der Auswirkung
und des Einflusses, die der zitierte Autor auf die betreffende Arbeit ausgeübt
hat.
Zitate sind sehr beliebte bibliometrische
Untersuchungsparameter, denn sie sind unaufdringlich
und sehr leicht zu erhalten. Anders als Fragebogen und Befragungen bedürfen
sie nicht der absichtlichen Kooperation des Befragten, was dessen Antwort
beeinflussen könnte.
Sie sind "Wegweiser", die nach jeder
Information hinterlassen wurden, und die als solche
verwendet werden sollen.
Problematik der Zitatenanalyse
Falls die Eigenschaften der Untersuchung es ermöglichen,
sollten bei der Zitatenanalyse zitierende und zitierte Arbeiten nach Autopsie
bearbeitet, und die Zitierungsgründe analysiert werden. Eine gute
Anwendung des Zitatenanalyseverfahrens setzt aber die Kenntnis dieser Probleme
voraus, damit, falls möglich, die notwendigen Maßnahmen zu deren
Vermeidung getroffen werden können. Nun werden hier die bekanntesten
Probleme und Einwände der Zitatenanalyse aufgelistet, sowie ihre üblichen
Beseitigungsmethoden:
1) Ein typographischer Fehler
Der kann leicht verursachen, daß ein wichtiges Zitat nicht berücksichtigt
wird. Solche Fehler können aber bei jeder EDV- Untersuchung auftreten.
Nur eine sorgfältige Durchführung der Arbeit kann dieses Problem
vermeiden.
2) Die willkürliche Auslassung eines wichtigen Zitates
Sie kann aus verschiedenen Gründen eintreten. Die wichtigsten
sind:
a) Die Arbeit, die zitiert werden sollte, ist dem Autor
nicht bekannt
In diesem Fall hat sie wahrscheinlich nicht die entsprechende Verbreitung
gefunden. Die Zitatenanalyse wird dann deren Verfasser die Notwendigkeit
einer besseren Mitteilung seiner Arbeit signalisieren. Dieses Phänomen
ist in der Bibliometrie unter dem Namen "Mendelsyndrom" bekannt,
da der berühmte Artikel von Mendel seinerzeit in einer unbekannten
Zeitschrift erschien und unbeachtet blieb. Dabei sollten die sogenannten
"schlummernden" Arbeiten erwähnt werden. Darunter versteht
man Arbeiten, die ursprünglich sehr wenige Zitate aufzeigten, aber
nach einigen Jahren wiederentdeckt und sehr häufig zitiert werden.
Bibliometrische Analysen ermöglichen ihre Ermittlung.
b) Das Auslöschen durch Eingemeindung oder Einverleibung
(engl. obliteration by incorporation)
Von diesem Phänomen sprach zum ersten Mal der in der Bibliometrie
sehr berühmte Forscher Merton. Damit bezeichnete er jene Ideen, die
so populär, assimiliert und bekannt geworden sind, daß sie als
kollektives Eigentum oder selbstverständliche Hypothese betrachtet
und nicht mehr zitiert werden. Diese Ideen sind aber so bekannt, daß
sich bei ihnen normalerweise eine bibliometrische Untersuchung erübrigt,
oder wenigstens keine gravierende Fehler auftreten können.
c) Anstatt originaler Arbeiten von unbekannten Autoren
werden "Review-Artikel" von bekannteren Verfassern zitiert
Unter einem "Review-Artikel" versteht man einen Artikel, der keine
neuen Ergebnisse oder Theorien enthält, sondern eine retrospektive,
kritische Darstellung der Entwicklung und des Standes der Forschung
in einem bestimmten Gebiet. Es gibt sogar Zeitschriften, die hauptsächlich
diese Art Arbeiten veröffentlichen, wie z.B. Physics Reports.
Solche Artikel, die einen sehr hohen bibliographischen Wert besitzen, werden
den in diesem Fach schon bekannten Forschern anvertraut. Aus diesem Grund
kann es schon geschehen, daß der zitierende Autor sich auf das Zitat
des Review-Artikels beschränkt. Diese Art des Zitierens wird dem sogenannten
"Matthew Effekt" zugeschrieben, nach dem bekannte Wissenschaftler
eine übertriebene Anzahl von Zitaten erhalten.
d) Die Unzugänglichkeit der Dokumente
Manche Dokumente sind dem zitierenden Verfasser wegen ihrer Sprache,
ihrer "tragenden" Zeitschrift (einer eher unbekannten und nicht leicht
erhältlichen Zeitschrift) oder Quelle (Report, Preprint, Dissertation
oder irgendeine graue Literatur), oder wegen Geheimhaltung nicht leicht
zugänglich, und werden aus diesen Gründen nicht zitiert.
e) Die künstliche Beschränkung der Anzahl der
Zitate
Die meisten Autoren gehen sehr sparsam mit der Anzahl der Zitate um.
Falls die Arbeit eine bestimmte Länge nicht überschreiten soll,
wird sicher bei den Referenzen gespart, was vom Gesichtspunkt des Verfassers
verständlich ist. Wie die meisten durchgeführten Versuche zeigen,
fehlt es an einer Erziehung des Zitierens, die nichts anderes als Berücksichtigung
und Anerkennung der Arbeiten der Kollegen bedeuten würde.
f) Ein wichtiger Einwand gegen die Zitatenanalyse ist die absichtliche
Weglassung von Zitaten aus Konkurrenzgründen.
In fast jedem Gebiet der Wissenschaft bilden sich häufig Gruppen
von Wissenschaftlern, die einander konkurrieren und deshalb wenig, wenn
nicht gar kein Interesse haben, die Ergebnisse oder Verdienste ihrer Konkurrenten
zu verbreiten oder zu zitieren.
In seiner schon oben erwähnten Untersuchung
über die Zitierungsgründe hat sich P. Vinkler auch mit den Gründen
für die Auslassung eines Zitats beschäftigt. Er fand, daß
Zitate aus folgenden Gründen ausgelassen werden:
- 10%, weil die Arbeit noch nicht bekannt war (in dieser Arbeit Grund
a)
- 42 %, weil der Autor diese Arbeit nicht so wichtig fand
- 26 %, durch Eingemeindung (b)
- 6 %, weil das Dokument nicht verfügbar war (d)
- 6 %, weil das Dokument falsche Behauptungen beinhaltet
- 10 %, aus anderen Gründen.
In der Studie von Vinkler fehlt leider der Grund, nach dem eher der
Review- Artikel eines bekannteren Wissenschaftlers bevorzugt wird. Dieses
Ergebnis zeigt jedoch, daß nur etwa 50% der Auslassungen korrekt
waren. Gegen solche Vorkommnisse zeigt die Zitatenanalyse kein Rezept auf.
Die Lösung dieses Problems kann nur von den Wissenschaftlern
3) Das Selbstzitieren
Zu einem gewissen Grade ist das Selbstzitieren gerechtfertigt, weil
eine Veröffentlichung oft auf früheren Arbeiten des Verfassers
beruht. Das Selbstzitieren kann aber die Anzahl der Zitate kaum wesentlich
erhöhen, und so die bibliometrische Untersuchung verfälschen.
Außerdem wäre Ausschließen der Selbstzitate EDV-mäßig
sehr leicht zu erreichen. Bei einer Online-Recherche würde der Befehl
" Not Author = " genügen, um Selbstzitate ausscheiden zu lassen.
Schwieriger zeigt sich die Ausscheidung von Selbstzitaten bei Arbeiten,
bei denen der Autor nicht als Erstgenannter aufscheint. Dieses Problem
fällt aber schon unter:
4) Die Mehrverfasserschaft
Sie wurde schon bei der Verwendung der Anzahl der Veröffentlichungen
als bibliometrischer Indikator als Schwierigkeit erwähnt. Sie kann
auch die Interpretation von Zitatenanalysen beeinflussen, wie D. Lindseyin
seiner Untersuchung gezeigt hat. Vor der Durchführung einer Zitatenanalyse
über das Werk eines bestimmten Wissenschaftlers wird dessen Bibliographie
benötigt, um seine Arbeiten mit anderen Autoren nachweisen zu können.
Falls alle Arbeiten, bei denen er als Mitverfasser mitgewirkt hat, nachgewiesen
wurden, wie kann sein eigener Verdienst bei jedem Beitrag eingeschätzt
und angerechnet werden? Lindsey plädiert für die Einführung
einer Korrektur für Mehrverfasserschaft. Solange der einzelne Beitrag
jedes Mitwirkenden nicht herauszufinden ist, scheint ihm eine Teilung der
Zitate durch die Anzahl der Autoren logisch.
5) Gefälligkeitszitierung oder willkürliche Schenkung
von Zitaten
Aus Sympathie- oder Allianz gründen können Wissenschaftler
einander in übertriebenen Verhältnissen zitieren. Diese Überzitierung
ist das Gegenteil von der Auslassung von Zitaten aus Konkurrenzgründen
(siehe 2)e)), und für sie gelten die gleichen Kommentare, wie sie
schon im obigen Paragraphen diskutiert wurden.
6) Kritische und negative Zitate
Es wird häufig angenommen, daß kritische und negative Zitate
eine Verfälschung der Zitatenanalyse zugunsten der "schlechten" Arbeiten
bewirken könnten. Jedoch zeigt die Erfahrung, daß "schlechte
Arbeiten" kaum zitiert werden. Die meisten Wissenschaftler finden keine
Zeit, sich mit solchen Arbeiten zu beschäftigen oder ihnen Beachtung
zu schenken. Kritische Zitate sind viel häufiger, haben aber auch
bibliometrischen Wert. Kritisch zitierte Arbeiten waren für die zitierenden
Autoren genügend wertvoll, um bestritten zu werden, vielleicht weil
sie aus ihren Fehlern gelernt haben, oder ganz einfach als Referenz oder
Vergleich benützt werden konnten.
7) Die Abhängigkeit vom Fachgebiet
Es wurde schon mehrmals signalisiert, daß die Zitatenanalyse
sehr stark vom Fachgebiet abhängt. Zum Beispiel erhalten in der Biochemie
Artikel im Durchschnitt mehr als 30 Referenzen, in der Mathematik hingegen
weniger als 10. Genauso wird in manchen Gebieten viel häufiger veröffentlicht
als in anderen. In der Physik zum Beispiel enthalten die Arbeiten über
Festkörperphysik viel weniger Zitate als jene über Kern- oder Hochenergiephysik;
diese letzten sollen jedoch mehr organische Zitate als jene über Kern-
und Festkörperphysik enthalten.
Das Altern der Literatur hängt auch vom Fachgebiet ab. Berücksichtigt
man das Alter der zitierten Dokumente, findet man, daß ein großer
Anteil der Zitate auf Literatur der letzten Jahre entfällt. Zum Beispiel
beträgt die mittlere Halbwertszeit in der Physik 4.6 Jahre (d.h. die Hälfte
der Referenzen in physikalischen Zeitschriften datieren von den 4.6 Jahren nach
Erscheinen des Artikels), in der Chemie 8.1 Jahre. Diesen aus der Kernphysik
stammenden Konzept der Halbwertszeit oder Halbleben, hat Price für
die Einschätzung der sogenannten "Härte" einer Wissenschaft
(engl. hard science) verwendet. Nach seiner Definition weisen große
Halbwertszeiten auf wenig "harte", wenig "wissenschaftliche" Zeitschriften hin.
Während z. B. in den physikalischen Zeitschriften 60% der Referenzen aus
den ersten 5 Jahren stammen, sind es in der englischen Literatur nur 10% . Nach
Price ist die Physik die "harte Wissenschaft par excellence" (sehr wissenschaftlich),
während die englische Literatur eine "nicht so harte" ist.
Solche Unterscheidungen bewirken, daß die Wahrscheinlichkeit
des Erhaltens eines Zitates vom Fachgebiet abhängt.
Interdisziplinäre Zitatenanalyse sollte diese Tatsache nicht
unbeachtet lassen.
8) Die Abhängigkeit vom Informationsträger.
Nicht alle Informationsträger werden gleich oft zitiert. So werden
Zeitschriften und Bücher mehr zitiert als Reports, Tagungen, und "graue"
Literatur. Selbst bei den Zeitschriften allein gibt es große Unterschiede,
wie z. B.: die geographischen; so ist die Anzahl der Zitate in russischen
Zeitschriften viel kleiner als in amerikanischen, europäischen oder
japanischen. Dafür enthalten die amerikanischen Zeitschriften im Durchschnitt
mehr organische Zitate als die russischen. Selbst bei den aus gleichem
Landstammenden Zeitschriften gibt es welche, die viel häufiger gelesen
werden, und deshalb eine größere Wahrscheinlichkeit des Erhaltens
von Zitaten aufweisen.
Um den Impakt der Zeitschriften einschätzen zu können,
wurde der sogenannte Impaktfaktor (engl. impact
factor) einer Zeitschrift von E. Garfield eingeführt.
Die Anzahl der Zitate, welche die Gesamtheit der Artikel einer wissenschaftlichen
Zeitschrift erhält, könnte schon als ein Indikator ihrer Benutzbarkeit
betrachtet werden. Allerdings würden dann umfangreiche Zeitschriften
(Zeitschriften mit vielen Artikeln) von vornherein bevorzugt werden gegenüber
solchen, die nur wenige Artikel enthalten, und häufig erscheinende Periodika
gegenüber seltener erscheinenden. Aus diesem
Grund wird die Anzahl der Zitate, die in einem bestimmten Zeitraum (üblicherweise
ein Zitierungsjahr) auf die Artikel eines Journals aus einem davorliegenden
Zeitraum (üblicherweise die beiden Jahre vor dem Zitierungsjahr) fallen,
durch die Anzahl dieser Artikel dividiert. Dieser relative Wert wird "impact
factor" genannt. Der "impact factor" selbst berücksichtigt nicht den Einfluß
von Review-Artikeln.
Jährlich erscheinen in SCI/JCR die Listen der Impaktfaktoren
der "wichtigsten" Zeitschriften.
Hier ist auch das nach Garfield benannte "Garfield's
law of concentration" (Konzentrationsgesetz) zu berücksichtigen,
das nichts anderes als eine Erweiterung des Bradfordschen Gesetzes ist,
und nach dem eine relativ kleine Anzahl von Zeitschriften für die
große Mehrheit der Veröffentlichungen in einem bestimmten Fachgebiet
sorgt, eine überproportional große Zahl von Zitaten auf sich
vereinigt und dadurch einen sehr hohen "Impact Factor" erhält. Dieser
Konzentrationseffekt wird verwendet, um die sogenannten "Kernzeitschriften"
eines Fachgebietes zu ermitteln.
Diese Tatsache würde Veröffentlichungen aus diesen "privilegierten"
Zeitschriften bei Zitatenanalysen, wie zum Beispiel der Auswahl der "citation
classics" sehr stark begünstigen. Um dieses Problem zu vermeiden,
wird es in diesem Fall (Zeitschriften mit kleinem Impaktfaktor) die klassische
Häufigkeitszitierungsgrenze auf 100 statt der üblichen
400 herabgesetzt.
9) Die Abhängigkeit von der Art der Arbeit.
Es wird behauptet, daß methodologische Arbeiten immer häufiger
zitiert werden, während Theorien und Begriffe durch Eingemeindung
im Vergleich weniger Zitate erhalten. Als Illustration dieser Tatsache
wird immer die Arbeit von O.H. Lowry erwähnt, in der eine neue Methode
zur quantitativen Eiweiß bestimmung dargelegt wird und welche einen
Rekord an Zitate (mehr als 100.000 seit 1951) erhält. Der große
Impakt dieser Arbeit bezieht sich nicht darauf, eine methodologische Arbeit
zu sein, sondern eine neue Orientierung in diesem Gebiet eröffnet
zu haben. Daß diese Arbeit mehr als z. B. die berühmte von Einstein
zitiert wird, bedeutet aber sicher nicht, daß sie wichtiger ist.
Diese Tatsache, am allerhäufigsten zitiert zu werden, drückt
einfach aus, daß sich mit dieser Arbeit derzeit sehr viele Forscher
befassen, und daß sich darin die aktuellen Interessen der wissenschaftlichen
Gemeinschaft widerspiegeln. Eine ungewöhnlich hohe Zitierungshäufigkeit
einer bestimmten Arbeit könnte auch unter besonderen Bedingungen als
Anomalie betrachtet werden.
Um diese Probleme (7, 8 und 9) zu vermeiden, schlagen
Small & Sweeney den "fractional citation counting" vor. Bei
der "Teilanzahl der Zitate" wird nicht die Summe der Zitate sondern deren
Bruchteil als Referenz (d.h. 1 dividiert durch die Länge der Referenzliste)
berücksichtigt. Erscheint das Zitat in einer Liste von 14 Referenzen,
so beträgt dessen "fractional citation countig" nur 1/14.
(Beispiel)
Eine andere Möglichkeit, diese Probleme zu berücksichtigen, ist die Verwendung des sogenannten "bibliometrischen Umfeldes" ("Environment of a scientific publication"). Dieses Umfeld bildet die für jede Analyse ausgewählte Sammlung von wissenschaftlichen Arbeiten, mit denen die betrachteten Arbeiten verglichen werden. Obwohl viele Methoden zur Definition dieses Umfelds vorgeschlagen wurden, hängt seine Auswahl sehr stark von Eigenschaft und Zweck der Studie ab.
Abschließend möchte ich folgende Worten von E. Garfield zitieren:
"...The citation is a precise, unambiguous representation of subject
that requires no interpretation and is immune to changes in terminology.
In addition, the citation will retains its precision over time. It also
can be used in documents written in different languages.."
7. Zitaten als Retrievalmethoden
I. Kozitation
oder Zitatengruppenanalyse oder engl. Clusteranalysis
Diese Analyse beruht auf zwei Hypothesen:
1) werden zwei Arbeiten von einer dritten gemeinsam zitiert, so gibt es eine
kognitive Verknüpfung zwischen beiden, und
2) die Stärke dieser Verknüpfung wird von der Häufigkeit angegeben,
mit der die beiden Zeitschriften zusammen zitiert werden.
(Garfield's Formel: S = Co-citations of A+B / (Totalcitations A+B)
- (Co-citations of A+B))
Die Gruppe von Arbeiten, die mit einer bestimmten, festgelegten Häufigkeit
gemeinsam zitiert werden, bildet ein Cluster. Das Konzept der Cluster
oder Gruppen des gemeinsamen Zitierens wurde gleichzeitig von G. Small in Philadelphia
und von I.W. Marschakowa in Moskau entwickelt (1973). So werden Cluster oder
Verbindungen zwischen Clustern aufgebaut. Die Cluster beziehen sich auf Fächer
oder Gebiete, ihre Verbindungen auf interdisziplinäre Beziehungen. Diese
Analyse bietet die Möglichkeit, die Struktur der Fachgebiete und deren
Beziehung zueinander zu erforschen, sowie die neuen Brennpunkte der Forschungsfronten
zu identifizieren. Im "ISI-Atlas of science" wurden verschiedene Ebenen
von Clustern verwendet, um "Vernetzungskarten" (engl. nested maps) aufzubauen
(mapping science).
II. Bibliographische
Kopplung (engl. bibliographic coupling)
Dieser Terminus wurde von Kessler 1963 eingeführt. Zwei
Dokumente sind bibliographisch gekoppelt, wenn ihre Referenzenlisten eine oder
mehrere Arbeiten teilen. In der bibliographischen Kopplung werden jüngere
Arbeiten verbunden, da sie gleiche ältere zitieren. In der Clusteranalyse
werden hingegen ältere Arbeiten verbunden, da sie
später von jüngeren Arbeiten zusammen zitiert werden.
Die bibliographische Kopplung ist eine innere, statische Verbindung der
Dokumente, während die Clusteranalyse eine äußere,
dynamische ist.
Der Nachteil der bibliographischen Kopplung ist, daß sie subjektiver Art
ist. Die Beziehung zwischen den Dokumenten erfolgt nach
den Angaben ihrer eigenen Autoren (die Referenzen werden
vom Autor selbst angegeben).
Die bibliographische Kopplung wird im SCI unter dem Befehl "Related Records"
(Themenverwandte Dokumente) verwirklicht.
8. DAS VERZEICHNIS DER VERZEICHNISSE: SCI
I. Der SCI als Datenquelle
Der SCI (SCIENCE CITATION INDEX: an international interdisciplinary
index to the literature of science, medicine, agriculture, technology, and the
behavioral and social sciences) wird von ISI
(= Institute for Scientific Information, Philadelphia) seit 1963 herausgegeben
(The scientist).
Als Vater dieses Verzeichnisses gilt der amerikanische Chemiker
und Bibliothekar Eugen Garfield.
II. Aufbau des interdisziplinären
Verzeichnisses
Der SCI ist eine internationale Zeitschrifteninhaltsbibliographie
mit fachlicher Beschränkung auf die Naturwissenschaft,
Technik, Medizin und die Verhaltenswissenschaft. Er ist eine fachübergreifende
Sammlung bibliographischer Daten aus Fachzeitschriften, die in gedruckter sowie
maschinenlesbarer Form als Datenbank angeboten wird. Zum naturwissenschaftlich
orientierten SCI kam 1973 der Social Science Citation Index (SSCI) (bis 1972
waren auch die Sozialwissenschaften einbezogen) und 1978 der Arts and Humanities
Citation Index (A&HCI) dazu. Zur Erstellung wird zur Zeit insgesamt ein
Kernsatz von zusammen 8000 Fachzeitschriften ausgewertet. Für die naturwissenschaftlichen
Disziplinen einschließlich Medizin sind es rund 5300 Zeitschriften mit
zur Zeit jährlich ca. 650.000 Veröffentlichungen und über 12
Millionen Zitierungen. Dieser Kernsatz umfaßt zwar nur etwa 10 Prozent
der gegenwärtig weltweit periodisch erscheinenden wissenschaftlichen Zeitschriften,
deckt damit aber mehr als 90 Prozent aller Zitierungen ab. Die Auswahl der Kernzeitschriften
ist nicht statisch, sondern wird jährlich nach einer Reihe von Kriterien
aktualisiert, wobei die Zitierhäufigkeiten eine wesentliche Rolle spielen.
Es scheint zunächst widersinnig, daß eine
Datenbank, die selbst keine inhaltliche Wertung von Forschungsergebnissen
vornimmt, trotzdem als Instrument für eine Bewertung geeignet sein
kann. Doch es gibt ein wesentliches Merkmal, das den SCI von anderen Literatur-Datenbanken
unterscheidet und ihn zugleich einmalig macht: In dieser Datenbank sind
von jedem Originalartikel neben den bibliographischen Angaben (Titel, Autoren,
Quelle) und dem Abstrakt (Inhaltskurzfassung) zusätzlich die Liste
aller Literaturverweise (Referenzen) im Anhang der Publikationen gespeichert
und suchbar. Dieser Referenzenteil ist sozusagen das Markenzeichen des
SCI, der damit die Doppelfunktion einer Literatur- und einer Referenzen-Datenbank
einnimmt. Dadurch ist es möglich, alle Veröffentlichungen zu
finden, die eine bestimmte Publikation (oder die Publikationen eines Wissenschaftlers,
eines Instituts oder eines Fachgebietes usw.) zitieren.
Dieser Index besteht aus folgenden Teilen:
1) SOURCE INDEX: seit 1955 - (bald seit 1945!)
enthält die zitierende Literatur:
Aufsätze aus ca. 3.300 Periodika
aus allen Ländern in originalen Sprachen
Fachliche Beschränkung auf die Naturwissenschaft, Technik, Medizin
und Verhaltenswissenschaft
Titelaufnahme:
Verfasser, Mitverfasser, Sachtitel (engl. + Originalsprache), Art des
Beitrages (Letter, Note, Review), Quelle (Abkürzung), Band, Heft-Nr.,
Seitenangabe, Jahrgang, Anzahl der Referenzen, Anschrift des ersten
Verfassers
+ Verzeichnung der Co-Autoren (Verw. auf 1.Verf.)
+ Referenzenliste
+ Abstrakt
Anhang: Aufsätze ohne Verfasserangabe (Titel der Zeitschrift)
+ Rezensionen aus 2 Zeitschriften: "Nature" und "Science"
2) CITATION INDEX:
enthält die zitierte Literatur. Sämtliche in den Aufsätzen
zitierte Schriften ohne Einschränkungen, aus allen Ländern,
in allen Sprachen, aus allen Erscheinungsjahren, aus allen Schriftenklassen
Titelaufnahme:
Erst genannter Verfasser (NUR DER ERSTE), Erscheinungsjahr.-
Jahr, Titel oder Zeitschriftentitel (abgekürzt) (kein T.
d. Aufsätze), Band, Seit
3) CORPORATE INDEX:
Register zum Source Index:
Titelaufnahme
Hauptteil:
"Geographic section": Institutionen, denen die Autoren d. Aufsätze
des Source Index angehören
Nebenteil: "Organization section": Institutionen nach Namen, verweist
auf "Geogr. Section"
4) PERMUTERM SUBJECT INDEX
(PSI):
1965 -
Stichtwortregister "Permuterm" als Sach-Erschließung
List of full stop words
List of semi-stop words
(verweist auf d. 1. Verfasser.)
5) JCR - JOURNAL CITATION REPORTS (JCR):
A bibliometric analysis of science journals in the ISI database.
seit 1975: statistische Analyse der erschlossenen Zitierzusammenhänge
+ "ranking lists" (Rang nach verschiedenen Parametern)
Kumulierungen des Titelmaterials u. aller Register
(Papierform):
jährlich + 5-Jahres-Kumulierung.
10-Jahres-Kumulierung.: 1955-64
Die Berichtszeiträume der vier Teile des SCI
sind:
1) Source Index (Quellen-Index): ab 1955
2) Permuterm subject index: ab 1966
3) Citation index: ohne rückwärtige Grenze
4) Journal Citation Reports: ab 1975.
Seit 1973: SSCI - Social Sciences Citation Index (Sozialwissenschaften)
Seit 1978: AHCI - Arts and Humanities Citation Index (Geisteswissenschaften)
III. Bibliometrische Indikatoren der
JCR
Definitionen der verwendeten bibliometrischen Indikatoren:
1) Die Zitierrate (Total Citations): Zahl aller Zitate, die auf eine bestimmte Zeitschrift oder ein bestimmtes Dokument im untersuchten Zeitperiode entfallen sind.
2) Impact Factor (Impaktfaktor):
Anzahl d. Zitate / Anzahl d. Artikel
Anzahl d. Zitate = alle Zitate, die in dem Zitierungsjahr auf die Artikel des
betrachteten Journals in einem bestimmten Zeitraum (die beiden Jahre vor dem
Zitierungsjahr) entfallen sind / Anzahl d. Artikel in diesen zwei Jahren
Zwei Jahre werden als Zeitraum betrachtet. Garfield rechtfertigt dies
damit, daß der durchschnittliche Artikel am häufigsten während
der zwei Jahren nach seinem Erscheinungsjahr zitiert wird.
3) Immediacy Index (Unmittelbarkeitsfaktor):
Wie viele Artikel einer Zeitschrift noch innerhalb desselben Jahres zitiert
worden sind; dabei wird die Anzahl der Zitate, die in diesem Jahr für Artikel
aus dem gleichen Jahr gezählt wurden durch die Anzahl der in dieser Zeitschrift
im gleichen Jahr veröffentlichten Artikel dividiert (ist
> 1, wenn einzelne Artikel noch im selben Jahr mehrmals zitiert werden).
Dieser Indikator soll ein Maß dafür sein, wie schnell der durchschnittliche
Artikel einer bestimmten Zeitschrift zitiert wird, d.h. mißt die
Geschwindigkeit der Informationsverbreitung.
Zeitschriften, die wichtige Informationen über neueste Forschungsarbeiten
publizieren, werden die Aufmerksamkeit der Wissenschaftler schneller auf
sich ziehen.
4) Half-Life (Halbwertszeit):
Man spricht vom Altern der Information und in Analogie zum radioaktiven Zerfall
auch von der Halbwertszeit wissenschaftlicher Literatur und meint damit die
Zeit, nach der die Zitierungsrate auf die Hälfte ihres anfänglichen
Wertes abgesunken ist. Die oben genannten Indikatoren benachteiligen Zeitschriften
in Fachgebieten mit großen Halbwertszeiten, da sie insgesamt
nur die drei aktuellsten Jahre berücksichtigen. Um für solche Zeitschriften
größere Zeiträume einzubeziehen, werden "Citing Half-life"
und "Cited Half-life" eingeführt. Citing Half-life
bezieht sich auf die Alterstruktur der Referenzen in einer Zeitschrift und bestimmt,
vom aktuellen Jahr an rückwärts gerechnet, den Zeitraum, in
dem sich 50% aller Referenzen befinden (Zeit, von der die Hälfte der Referenzen
einer Zeitschrift in dem betrachteten Jahr stammen).
Cited Half-life bezieht sich auf die Altersstruktur der Zitate, die auf
eine Zeitschrift entfallen und bezeichnet analog den Zeitraum, in dem
50% aller Zitate liegen. Beide messen das Veralten (engl. "obsolescence")
und die "Härte" (engl. "hardness") der Zeitschrift.
IV. Aufbau von JCR
Die Zitierdaten der untersuchten Zeitschriften werden
dem Benutzer in folgenden Abschnitten angeboten:
1. Abschnitt: "Journal Rankings"
Er dient als Überblick über die wichtigsten
Daten und listet sie nach sechs verschiedenen Kriterien auf:
Liste 1 ordnet die Zeitschriften
in alphabetischer Ordnung
Liste 2 ordnet die Daten nach Gesamtzitaten
Liste 3 nach Impact Factor
Liste 4 nach Inmediacy Index
Liste 5 nach der Anzahl der veröffentlichten Artikel
Liste 6 nach der Zahl der auf die beiden vorangegangenen
Jahre entfallenen Zitate
2. Abschnitt: "Source data listing"
Er liefert eine Referenzenanalyse aller Quellenzeitschriften.
Jeder Artikel wird nach Typ klassifiziert: Review oder Non-review
Artikel. Als Review gilt ein Artikel, der mehr als 100 Referenzen oder
das Wort "review" im Sachtitel oder in seiner Beschreibung enthält.
Für jede Artikelklasse sowie für beide Klassen gemeinsam wird
die Zahl der Artikel, die Anzahl der darin erscheinenden Zitate und
der Quotient aus diesen Werten bestimmt. Dieser Abschnitt beantwortet die
Frage, ob und in welchem Umfang eine Zeitschrift Review-Artikel veröffentlicht.
3. Abschnitt: "Journal half-life
listing"
Dieser Abschnitt bietet in drei Listen Informationen
über Halbwertszeiten von Referenzen und Zitierungen von Zeitschriften.
Liste 1 listet für die zehn aktuellsten Jahre die
kumulierten Prozentanteile an den Gesamtreferenzen auf. Daraus wird für
jede Zeitschrift, die mindestens 100 mal in diesem Jahre zitiert worden
sind, das Citing Half-life bestimmt.
Liste 2 listet die kumulierten Prozentanteile an den
Gesamtzitierungen auf. Daraus wird, für jede
Zeitschrift, das Cited Half-life bestimmt.
Liste 3 ordnet die Zeitschriften nach diesem Merkmal.
4. Abschnitt: "Subject category
listing"
Er ordnet die ausgewerteten Zeitschriften einem oder
mehreren Fachgebieten zu. Innerhalb der Gruppe werden die Zeitschriften
nach deren Impact Factor gereiht. Das Cited Half-life wird auch angegeben.
Ein Register zu dieser Liste
verzeichnet zu jeder Zeitschrift die ihr zugeordneten Fachgebiete.
5. Abschnitt: "Citing journal listing"
Für jede Zeitschrift erfolgen die Angaben, welche
Zeitschriften und wie häufig sie zitiert hat.
(Folie 17)
6. Abschnitt: "Cited journal listing"
Für jede Zeitschrift erfolgen die Angaben, von welchen
Zeitschriften und wie häufig sie zitiert wurde.
Zusätzlich werden alle verzeichneten Zeitschriften
nach deren Abkürzung aufgelistet (List of the full titles of
citing/cited journals arranged alphabetically by abbreviation).
Die Abkürzung verweist auf den Volltitel. Titeländerungen
werden auch alphabetisch verzeichnet (Journal Titel Changes)
V. SCI auf CD-ROM
Optionen der "Results" via "Toolbar":
Related Records and Parent Records
Anzeige der zitierten Dokumente:
Optionen bei Print/Save (alte CD-ROM Version)
Als Beispiele dienen folgende Online Recherchen
in SCI:
1) Wie häufig wird
Prof. Hans-Peter Karnthaler zitiert?
2) Wie häufig wird
Albert Einstein zitiert?
SCI ist im Internet unter "Web of Science" zu finden:
Web
of Science*:
The Web of Science (WoS) provides access to over 22 Million bibliographic
records covering all fields of research from the past 25 years. It includes
the Science Citation Index Expanded, the Social Sciences Citation Index and
the Arts & Humanities Citation Index.
JCR
: Journal Citation Reports* :
The two editions of the JCR provide citation data (e.g. journal
impact factors) of nearly 5.000 science journals and 1,700 social sciences journals.
Essential Science Indicators (ESI)
ESI was updated on January 1, 2003 to cover ten years
plus ten months, January 1992 - October 31, 2002
provides internet access to a unique and comprehensive compilation
of essential science performance statistics and science trends data derived
from ISI's databases. The chief indicators of output, or productivity, are journal
article publication counts. For influence and impact measures, ESI employs both
total citation counts and cites per paper scores. The former reveals gross influence
while the latter shows weighted influence, also called impact.
Unter Citation Rankings:
Scientists kann man finden, wie häufig ein bestimmter Forscher
zitiert wird.
Ein Vergleich mit anderen Forschern aus gleichem Gebiet wird auch angeboten:
Unter Citation Rankings:
Institutions kann man finden, wie häufig eine bestimmte Körperschaft
zitiert wird:
Ein Vergleich mit anderen Institutionen aus gleichem Gebiet
(z. B. Materials Science) wird auch angeboten:
Unter Citation Rankings:
Countries ist die gleiche bibliometrische Analyse für ein bestimmtes
Land zu finden:
a) citations per paper:
b) Gesamtanzahl der Citations:
Unter Most Cited Papers: Highly Cited Papers (last 10 years) kann man die in den letzten zehn Jahren am meistens zitierten Arbeiten:
entweder nach dem Gebiet (Physics)
oder nach dem Land (Austria) oder Institution:
Unter Most Cited Papers:
Hot Papers (last 2 years) ist
die gleiche Bibliometrische Analyse innerhalb der letzten zwei Jahren zu finden:
Unter Citation Analysis Research - Baselines sind zwei andere bibliometrische Analysen zu benützen:
Unter Average Citation Rates wird die mittlere Zitierhäufigkeit je nach dem Fach errechnet (ein Paradebeispiel für die Abhängigkeit der Impaktfaktoren vom Fachgebiet):
Unter Percentiles wird die Anzahl
der Zitate verstanden, die eine Arbeit in einem bestimmnten Fachgebiet benötigen
wurde, um 0,01, 0,10 oder 1,00 oder 10% der Gesamtzitate in diesem Gebiet zu
erhalten.
Die Percentiles werden hier errechnet und zeigen, wie sich die Zitierhäufigkeit in einem bestimmnten Fachgebiet innerhalb der letzten zehn Jahren entwickelt hat:
To read this table:
The Percentiles page is divided into sections for each individual scientific
field, with the "All Fields" section combining all data. Within each
section are rows for the four percentile breakdowns (0.01%, 0.1%, 1%, and 10%).
Data for the percentiles are given for the last 10 years, with the "All
Years" column using all data for those years.
See the picture above. In the Chemistry portion of the table, a value of 66,
for instance, in the 0.01% column for 1998 indicates that the top 0.01% of papers
in chemistry journals in that year have since been cited a minimum of 66 times.
Unter Citation Analysis
Research Fronts werden die Research Fronts ("current
articles can be organized into subject areas according to the clusters of older
papers that they cite in common") identifiziert:
Die können nach deren Namen oder innerhalb eines Fachgebietes gesucht werden:
Hinweise:
Ganz angenehm sind die zahlreichen Optionen, die das Sortieren
der Ergebnisse nach verschiedenen Kriterien ermöglichen.
In dem Teil Citation fällt außerdem die Einschränkung
"nur erster Autor" aus, allerdings nur für diese Arbeiten, die in
dem Source Teil verzeichnet werden.
Allgemeine Kritik an SCI und an JCR:
1) Umfang des Datenmaterials:
3) Auswahlpolitik für auszuwertende Zeitschriften
4) Fehler bei der Verarbeitung der Zitierdaten
5) Die JCR-Daten sind nicht repräsentativ genug
6) Korrelation von Zitierfrequenzen aus Zitatenanalysen und Benutzungsfrequenzen in Bibliotheken ist nicht so hoch wie erwartet
Kritik an "Impact Factor":
1) Kritik am Zeitraum der ausgewerteten Daten (aus den
beiden letzten Jahren)
2) Kritik am Umfang der auszuwertenden und ausgewerteten
Daten
3) Kritik an der Qualität der ausgewerteten Daten
(Selbstzitate!, Titeländerungen)
4) Mißverständnisse bei der Interpretation
5) Einfluß auf die Verlage und die Publikationsformen
("E. Garfield beherrscht mit absolutistischer Macht
die wissenschaftliche Szene. Editors und Verleger von Journals, die zitiert
werden wollen, geben sich in Philadelphia die Klinke in die Hand",
Lindner)
Praktische Nachteile von SCI:
1) Nur erster Autor wird zitiert!
2) Formale Fehler (Computer-generiertes Verzeichnis)
Sie können von den Autoren der Originaltexte verursacht
oder während der verlegerischen Produktion entstanden sein. Diese
Fehler sind in Abhängigkeit vom Arbeitsaufwand zum Teil korrigierbar
(ca. 1% aller Bandangaben sind fehlerhaft), Mangel an Konsequenz!
3) Probleme mit Homographen (Autoren mit gleichem
Namen)
4) teuer
9. Präsentation der Ergebnisse
Folgende Beispiele dienen als Muster:
a) Auswirkung einer individuellen
Arbeit
b) Eminenz eines bestimmten Forschers: Beispiel
1 und Beispiel 2
c) Prestige und Leistung einer bestimmten Forschungsanstalt,
(by citation impact oder by total
citations), einer Firma oder eines Landes,
d) Internationale Vergleiche für ein
bestimmtes Fachgebiet
e) Bei Zitatenanalysen von Zeitschriften werden die Zitierfrequenzen
aller in einer Zeitschrift enthaltenen Artikel summiert und die Summe als
Maß für den Wert der Zeitschrift angesehen. Die Auflistung nach
verschiedenen Kriterien ist die einfachste Art der Präsentation. Paradebeispiele
liefern die Ranking-Listen der JCR. Unter Einsatz der elektronischen Datenverarbeitung
sind auch mehrdimensionale Darstellungsarten entwickelt worden.
Besondere Beachtung finden die sogenannten "one-stepmaps"
bzw. "two-step maps", bei denen jeweils
diejenige Zeitschrift B bestimmt wird, die von einer Zeitschrift A am häufigsten
und bzw. am zweithäufigsten zitiert wird. Dabei werden Selbstzitate,
d.h. Zitate anderer Artikel der gleichen Zeitschrift nicht berücksichtigt.
Bei der Einbeziehung einer definierten Menge von Zeitschriften entsteht
ein Netzwerk, in dem die Zuordnung "A zitiert am häufigsten B"
durch einen Pfeil repräsentiert wird.
Eine andere sehr gebrauchte Darstellungsmethode ist die
Cluster-Analyse,
nach der Zeitschriften, die sich gegenseitig häufig zitieren als andere,
eine inhaltliche zusammenhängende Gruppe bzw. einen Cluster
bilden.
Der Informationswert der Cluster-Analyse basiert auf der Verarbeitung
einen großen Menge von elektronisch gespeicherten Zitierdaten und
eines ausgefeilten Iterationsprozesses (Software). Wegen ihres riesigen
operationalen Aufwandes wird diese Methode meistens nur bei Untersuchungen
in der Wissenschaftskunde verwendet.
"By citing other works, authors create footprints in
the landscape of scholarly achievement".
Diese "Spuren" sind die wichtigsten Instrumente, die
uns für das Studium der Entwicklung und Struktur der Wissenschaft
zur Verfügung stehen. Obwohl die Häufigkeit des Zitierens einer
Arbeit nichts Endgültiges über ihre Qualität, jedoch über
ihre Auswirkung aussagt, kann man mit großer
Wahrscheinlichkeit behaupten, daß eine häufig zitierte Arbeit,
ein wichtiges, wissenschaftliches Ergebnis enthält, oder daß
sie, nach den Worten von Cronin, eine tiefe Spur hinterlassen hat.
Die Einführung der Zitate als Bewertungsmethode des
Impakts einer Arbeit hat die aktuelle "Veröffentlichungskrankheit"
entlarvt: Mehr als ein Drittel dieser Arbeiten werden nicht einmal
zitiert. Würden zusätzlich die Selbstzitate betrachtet,
stiege diese Zahl dramatisch.
Mehrere Untersuchungen von E. Garfield zeigen, daß
die mittlere Zitatenjahresquote von zitierten Veröffentlichungen bei
etwa 1,7 liegt oder daß die festgelegte Schwelle der für diese
Quote, die bei 15 bis 17 Zitaten liegt, von weniger als 1 Prozent der im
"Science Citation Index" verzeichneten Arbeiten überschritten wird.
Nur extrem wenige Veröffentlichungen werden oft
zitiert (z.B. mehr als 100 mal) und sehr viele nur selten (1-10 mal) oder
überhaupt nicht. Eine solche unsymmetrische Verteilung wird in Anlehnung
an die Untersuchungen über die Verteilung von Einkommen von V. Pareto
zu Ende des vorigen Jahrhunderts als Pareto-Verteilung bezeichnet. Fast
50 Prozent aller vom SCIENCE CITATION INDEX erfaßten Veröffentlichungen
aus dem Zeitraum 1981-1985 wurden im Zeitraum von 5 Jahren nach ihrem Erscheinen
kein einziges Mal von anderen Autoren zitiert. Der Anteil der mehr als
einmal zitierten Publikationen wurde auf nur 20 Prozent abgeschätzt.
Dazu muß einschränkend bemerkt werden, daß 1/4 der erfaßten
Veröffentlichungen Kurzmitteilungen sind, die in der Regel nicht zitiert
werden. Für den Bereich der Naturwissenschaften allein und bei Nichtberücksichtigung
der Kurzmitteilungen beträgt der Anteil der nicht
zitierten Veröffentlichungen immerhin noch 23 Prozent
(aus einer Zitierungsanalyse der Veröffentlichungen in 1984 und deren
Zitierungen bis Ende 1988).
Natürlich gibt es auch Kontroverse über die
Gültigkeit
dieser Methode und ihre richtige Anwendung und Interpretation. Keine
Bewertungsmethode kann aber durchaus objektiv und perfekt sein. Es werden
sicher immer einzelne Fälle von Benachteiligungen auftreten, es wird
auch sicher immer sehr gute Veröffentlichungen geben, deren Bedeutung
und Qualität erst viele Jahre nach ihrem Erscheinen, wenn überhaupt,
anerkannt werden.
Solche bibliometrischen Untersuchungen können aber
zweifellos einer besseren Orientierung und Beurteilung der wissenschaftlichen
Leistung von konkreten Forschern und Forschungsanstalten dienen. Die erfolgreiche
Durchführung solcher Analysen setzt aber gute Kenntnisse über
diese Methode, deren Schwäche, Mängel und Einschränkungen
voraus. Fehlplanungen und -urteilen sind sehr gefährlich, wenn man
betrachtet, von welch großer Bedeutung die Interpretation der Ergebnisse
sein kann.
1. Gorraiz, J.: "Die unerträgliche Bedeutung der
Zitate".
In: Biblos. Jg. 41 (1992), H. 4, S.193-204.
2. Lawani, S.M.: Bibliometrics: Its Theoretical Foundations,
Methods and Applications.
In: Libri. Copenhagen. Jg. 31 (1981),
S. 294-315.
3. Pritchard, A.: Statistical Bibliography or Bibliometrics?
In: Journal of Documentation. London.
Jg. 25 (1969), H. 4, S. 348-349.
4. Garfield, E.: Is citation analysis a legitime evaluation
tool?
In: Scientometrics. Amsterdam. Jg.
1 (1979), S. 359-375.
5. Garfield, E.: In Tribute to Derek John de Solla Price:
A Citation Analysis of Little Science, Big Science.
In: Scientometrics. Amsterdam. Jg. 7 (1985),
H. 3-6, S. 487-503.
6. Vinkler, P.: A quasi-quantitative citation model.
In: Scientometrics. Amsterdam. Jg. 12 (1987),
H. 1-2, S. 47-72.
7. Schlögl, Christian: "Gefahren und Nutzen von bibliometrischen Untersuchungen am Beispiel Informationsmanagement", 26. Österreichischer Bibliothekartag "Produktionsfaktor Wissen", UniversitätsCampus Wien, 19. - 23. September 2000
8. Werner Marx und Gerhard Gramm: Wächst der Wissenschaft das Wissen über den Kopf?
Elektronische Dokumente zum Thema Bibliometrie, Scientometrie
Benjamin F. Bowman, Werner Marx, Urs Schoepflin:
Anmerkungen zum Einsatz
von Zitierungsanalysen für die Forschungsevaluation
Werner Marx, Hermann Schier, Michael Wanitschek:
Kann man Forschungsqualität
messen? .
(erschienen im MPG-Spiegel 3/1998)
(Zitierungszahlen als Maß für Resonanz auf wissenschaftliche
Aktivität)
Teresa Y. Neely:
The Impact
of Electronic Publications on Promotion and Tenure Decisions
(über Bedeutung elektronischer Veröffentlichungen für
bibliothekarische Karrieren, primär in wissenschaftlichen Bibliotheken
der USA , Oktober 1999)
Tobias Opthof *
Sense
and nonsense about the impact factor