blogcensus - Wir vermessen die Blogosphäre.

Der neue Dienst blogcensus soll endlich die Frage klären, die seit Jahren durch die deutschen Blogs schwirrt: Wie viele deutschsprachige Blogs gibt es eigentlich?

Mit speziell konzipierten Suchmechanismen und redaktioneller Pflege der Datenbank sollen alle deutschsprachigen Blogs gefunden werden. Bei diesen Blogs wird regelmäßig per RSS-Feed überprüft, ob sie aktualisiert wurden. So soll kein riesiger Blog-Friedhof in unserer Datenbank entstehen, sondern eine stets aktuelle Liste von Blogs, die zur Zeit tatsächlich existieren. Nimmt die Zahl der Blogs ab, steigt sie? Auch diese Frage will blogcensus klären.

In einer weiteren Phase soll herausgefunden werden, mit welchen Bloganbietern oder welcher Blogsoftware gebloggt wird, ob mehr Frauen oder Männer bloggen, in welchen Städten oder Bundesländern am meisten gebloggt wird, etc. Im Mittelpunkt von blogcensus stehen dabei nicht wenige populäre Blogs, im Mittelpunkt steht jedes einzelne Blog. Die Gesamtheit ist entscheidend.

Bis wir Ihnen an dieser Stelle in wenigen Wochen erste konkrete Analyse-Ergebnisse präsentieren, können Sie in Echtzeit mitverfolgen, wie viele deutschsprachige (und aktuell gepflegte) Blogs sich in unserer Datenbank ansammeln:

blogcensus kennt zur Zeit 55.544 deutschsprachige Blogs.

Links mit Blogbeiträgen zu diesem Thema

Hinweis zum Crawler

Vereinzelt kam die Frage auf, wie sich ein Blog "austragen" könnte. Zum einen werden wir die Möglichkeit bieten, sein eigenes Blog bei uns so zu markieren, dass wir die URL nicht wieder besuchen.

Zum anderen werden wir aber auch die robots.txt beachten. Momentan werden einzelne Blogs aber noch gar nicht automatisch besucht um z.B. den RSS-Feed, oder andere Meta-Daten einzulesen. Im Moment besuchen wir die Blogs nur händisch per Browser um zu sehen, ob es sich um ein deutschspachiges Blog handelt, oder nicht.

Sobald der Crawler einzelne Blogs besucht, wird hier erklärt werden, wie man den Crawler gezielt in der robots.txt ansprechen kann. Er wird sich aber auf jeden Fall durch die Zeichenkette Blogcensus.de im User Agent zu erkennen geben.