|
|
|
|
|
P&T SES Search Engine Systems - Jeanie 2009 Live
|
Contents Spider Jeanie 2009
Damit Sie einen ersten Einblick in die Arbeitsweise
von Jeanie 2009 bekommen, haben wir Ihnen die folgenden
Videos zusammen gestellt.
An Hardware haben wir einen Laptop mit niedriger
Leistung verwendet.
Damit möchten wir die Leistungsfähigkeit unserer
Systeme unterstreichen, denn bei einem PC/Server
mit 2.6 GHz, 3 GHz oder höher
ist der Leistungsindex um einige Prozente besser.
|
|
Video Eins:
Contents Spider Jeanie 2009 wurde mit den folgenden Einstellungen gestartet:
• Die Analyse wurde ausgeschaltet bis auf:
1. Extract alle Urls
2. Analysiere die Sprache der Webseite
3. Ermittele den Iso-Code der Sprache
4. Ermittele die Server und Domain IP
• Domain-Filter sind keine vorhanden
• Keyword-Filter sind keine vorhanden
• Sonstige Überprüfungen sind ausgeschaltet
• In der Todo befanden sich beim Start ca. 1405 Urls
• Thread - Anzahl: 50
• Strategie-Level = 1, (Bedeutet: 20 % der aktiven Threads analysieren, extrahieren, indexieren
u. 80 % analysieren, indexieren.)
• Die max. Dateigrösse für Webseiten wurde auf 1800 KB begrenzt
• TimeOut wurde auf 20 Sekunden eingestellt
• Computer: Laptop Core 2 Duo 2 x 1,6 GHz, 3 GB RAM, Windows XP Professional
Download Video Eins - ca. 120 Minuten - 1.91 GB
Video Zwei:
Contents Spider Jeanie 2009 wurde mit den folgenden Einstellungen gestartet:
• Die Analyse wurde ausgeschaltet bis auf:
1. Indexiere nur die Startseite einer Domain
2. Extract alle fremden Urls
3. Analysiere die Sprache der Webseite
4. Ermittele den Iso-Code der Sprache
5. Ermittele die Server und Domain IP
• Domain-Filter sind keine vorhanden
• Keyword-Filter sind keine vorhanden
• Sonstige Überprüfungen sind ausgeschaltet
• In der Todo befanden sich beim Start ca. 827 Urls
• Thread - Anzahl: 50
• Strategie-Level = 1
• Die max. Dateigrösse für Webseiten wurde auf 1800 KB begrenzt
• TimeOut wurde auf 20 Sekunden eingestellt
• Computer: wie bei Video Eins
Download Video Zwei - ca. 30 Minuten - 760 MB.
Video Drei:
Contents Spider Jeanie 2009 wurde mit den folgenden Einstellungen gestartet:
• Die Analyse wurde ausgeschaltet bis auf:
1. Indexiere nur die Startseite einer Domain
2. Url Extract ist ausgeschaltet
3. Analysiere die Sprache der Webseite
4. Ermittele den Iso-Code der Sprache
5. Ermittele die Server und Domain IP
• In der Todo befanden sich beim Start ca. 1,3 Millionen Domains
• Domain-Filter sind keine vorhanden
• Keyword-Filter sind keine vorhanden
• Sonstige Überprüfungen sind ausgeschaltet
• Thread - Anzahl: 50
• Strategie-Level = 1
• Die max. Dateigrösse für Webseiten wurde auf 1800 KB begrenzt
• TimeOut wurde auf 20 Sekunden eingestellt
• Computer: wie bei Video Eins
Download Video Drei - ca. 30 Minuten - 540 MB.
Video Vier:
Contents Spider Jeanie 2009 plus wurde mit den folgenden Einstellungen gestartet:
• Die Analyse wurde wie folgt eingestellt:
1. Analysiere die Sprache der Webseite
2. Ermittele den Iso-Code der Sprache
3. Ermittele den Ländercode der Webseite
4. Ermittele die Geodaten, Latitude u. Longitude - Modul: Optional
5. Ermittele die Server und Domain IP
6. Title Mehrfachwort-Analyse
7. Akzeptiere keine doppelte Title
8. Description Mehrfachwort-Analyse
9. Akzeptiere keine Doppelte Description
10. Wenn Description nicht vorhanden od. von der Analyse verworfen, erstelle aus
Webseitentext eine neue Description
11. Ermittele die Standortdaten
12. Extract alle Urls
13. Berücksichtige auch Urls mit QueryStrings
14. Berücksichtige keine Urls mit Frontpage-Verweise
15. Indexiere alle Urls
• Domain-Filter, hier befinden sich ca. 100 uninteressante Domains wie: ebay, msn, google usw.
• Keyword-Filter sind keine vorhanden
• In der Todo befanden sich beim Start 1405 Domains
• Thread - Anzahl: 50
• Strategie-Level = 1
• Die max. Dateigrösse für Webseiten wurde auf 1800 KB begrenzt
• TimeOut wurde auf 20 Sekunden eingestellt
• Computer: wie bei Video Eins
Download Video Vier - ca. 58 Minuten - 916 MB.
Für Rückfragen stehen wir Ihnen gerne zur Verfügung.
P & T
Spider/Bot Technology - Contents Analysis
|
|
|
|
© 2004-2008 P & T Spider/Bot-Technology - Contents Analysis - All Rights Reserved
|
|