|
Mit der systematischen Untersuchung des Internets oder Teilen davon befasst sich auch eine Reihe anderer Websites. Zu den Angeboten, die sich mit vergleichbaren Fragen befassen, zählen (sortiert nach Aktualität und Relevanz und ohne Anspruch auf Vollständigkeit):
- Die Firma ^ Netcraft führt monatliche Untersuchungen des Internets durch, insbesondere den ^ Web Server Survey und den ^ SSL Survey. Die Ergebnisse sind zum Teil veröffentlicht, zum Teil nur käuflich zu erhalten.
- Unter ^ SecuritySpace.com werden monatlich verschiedene ^ Reports über Internet-Angebote aller TLDs veröffentlicht. Diese reichen bis ins Jahr 1998 zurück. Sie erfassen einen deutlich größeren Teil des Internets, die frei zugänglichen Auswertungen sind jedoch weniger detailliert als die Auswertungen dieses Angebots.
- Die Firma ^ Port80 Software führt regelmäßige ^ Untersuchungen der Internetangebote der ^ U.S.-Fortune-1000-Unternehmen durch.
- Die österreichische Registrierungsstelle veröffentlicht ^ regelmäßige Untersuchungen verschiedener inhaltlicher Aspekte der österreichischen Domains.
- Der ^ ISC Internet Domain Survey der Firma ^ Internet Systems Consortium, Inc. stellt eine halbjährliche umfassende DNS-bezogene Analyse des gesamten Internets dar. Die Ergebnisse sind auf reine Host- und Domainzahlen begrenzt.
- Die Firma ^ Verisign veröffentlicht regelmäßig einen sog. ^ Domain Name Industry Brief, in dem Trends und Analysen der Entwicklung des gesamten Internets präsentiert werden.
- Die ^ DENIC eG veröffentlicht eine laufende ^ Statistik über die Anzahl derde-Domains. Auch Auswertungen über die regionale Verteilung von Domains in Deutschland sind dort verfügbar.
- ^ RIPE NCC führt monatliche ^ Hostcounts durch. Detaillierte Angaben zur TLD ".de" sind nur bis ^ August 2005 verfügbar.
- Verschiedene ^ DNS-bezogene Untersuchungen präsentiert die Firma ^ The Measurement Factory.
- Unter dem Titel ^ Exploring the UNKNOWN: Scanning the Internet via SNMP! ist eine im Jahr 2008 durchgeführte Durchsuchung von 2,5 Millionen IP-Adressen auf SNMP-Zugriffsmöglichkeiten beschrieben.
- "Nikita The Spider" nennt Philip Semanchuk zwei ^ Untersuchungen von jeweils ca. 10.000 Webseiten im Jahr 2008. Ebenfalls von dieser Quelle stammen drei ^ Analysen von robots.txt-Dateien.
- Statistiken von 4,5 Millionen im Jahre 2007 analysierten HTML-Seiten finden sich ^ hier.
- Eine sog. ^ IPv4 WHOIS Map wurde 2007 von ^ CAIDA (Cooperative Association for Internet Data Analysis) erstellt.
- Für die Studie ^ Wissen Sie, was Sie tun? Wissen Sie, wer es noch weiß? der ^ XAMIT Bewertungsgesellschaft wurden "zwischen August und September 2007 mehr als 655.000 deutsche Webseiten von 14.000 Unternehmenund Gemeinden" untersucht. Analysiert wurde die Nutzung von Webtracking-Diensten.
- Ebenfalls aus dem Jahr 2007 stammt die Studie ^ Domain name industry report der Firma ^ Nominet mit Schwerpunkt auf der Top Level Domain "uk" (Nominet ist die britische Domainverwaltung ähnlich der DENIC).
- In der empirischen Studie ^ Linguistische Aspekte von Domain-Namen untersucht Gordon Böhme verschiedene sprachlich-syntaktische Aspekte von de-Domainnamen für den Zeitraum von 2000 bis 2006.
- Mehrere interessante Aspekte von HTML-Seiten untersucht Rene Saarsoo in der Studie ^ Coding practices of web pages. Enthalten sind auch detaillierte methodische Hinweise über die verwendeten Techniken.
- Unter dem Titel ^ Fingerprinting the World's MailServers veröffentlichen Ken Simpson und Stas Bekman die Ergebnisse einer Untersuchung von SMTP-Servern.
- Auf Basis einer Analyse von über einer Milliarde Seiten im Dezember 2005 veröffentlicht Google verschiedene Ergebnisse als ^ Web Authoring Statistics.
- ^ ValiWatch 2005, eine der(nach eigenen Aussagen) "größten Erhebungen über das deutsche Web", stellt eine einmalige Untersuchung mehrerer hunderttausend deutschsprachiger Webangebote dar. Es werden teilweise ähnliche Auswertungen wie in diesem Angebot vorgenommen.
- Unter dem Titel ^ Semantics in the wild veröffentlicht John Allsopp 2005 eine begrenzte Untersuchung von id- und class-Attributen in HTML-Seiten.
- In der Veröffentlichung ^ Characteristics of .au Websites: An Analysis of Large-Scale Web Crawl Data from 2005 wird eine punktuelle Analyse australischer Domains durchgeführt.
- Der ^ BVDW (Bundesverband Digitale Wirtschaft e.V.) stellt die Studie ^ Kommerzielle deutsche Webseiten 2004 bereit, die auf einer teilweise automatisierten Inhaltsanalyse von über 15.000 zufällig ausgewählten .de-Domains des Jahres 2004 beruht.
- In der Dissertation ^ Effective Web Crawling von Carlos Castillo finden sich in Kapitel 8 einige Aussagen über das chilenische Web des Jahres 2004.
- ^ D. J. Bernstein, Professor an der ^ University of Illinois at Chicago präsentiert ^ verschiedene ältere Untersuchungen, die sich auf die Aspekte DNS und SMTP konzentireren. Auf diese baut die ^ DNS server survey von Don Moore aus dem Jahre 2004 auf.
- Die Verteilung von Webservern im Jahr 2000 und 2004 wird in ^ The Business Web Server Survey untersucht.
- ^ ZookNIC enthält u.a. einige Details über Domaindaten der Jahre 2000 und 2001, z.B. die Auswertung ^ Average Length of Domain Names, die ein vergleichbares Ergebnis wie die entsprechenden Analysen auf domain-scan.net (Auswertung "Domainnamen") liefert.
- ^ Netfactual präsentiert einige ^ Detailanalysen vor allem auf Grundlage von Daten aus dem Jahr 2000.
- Eine detaillierte, allerdings ältere ^ Analyse von SSL-Servern hat Eric Murray im Jahr 2000 durchgeführt.
- "Russian Internet Survey" ist eine ^ Auswertung des russischen Internets bis zum Jahre 2000 betitelt (auf Russisch).
- Eine Untersuchung auf Meta-Attribute aus dem Jahre 1997 ist Bestandteil des ^ Dictionary of HTML META Tags.
Die folgenden Links weisen auf Artikel und andere Ressourcen rund um das Thema Internet- und Web-Mining:
Hinweise auf andere Untersuchungen oder Ressourcen nehme ich gerne entgegen.
|
|
Aktualisiert ( Dienstag, 01. September 2009 um 16:33 )
|