Aufgedeckt! Die 200 Parameter des Google Algorithmus …

von Florian, geschrieben am 16. Februar 2010

Vor kurzem hat Ann Smarty im Search Engine Journal dazu aufgerufen, die 200 Parameter des Google Algorithmus zu sammeln und aufzulisten. Im zugehörige Thread im Webmaster Forum wurden mittlerweile fleissig Vorschläge und Vermutungen gepostet. 200 sind es dann doch nicht geworden und bei einigen ist man sich auch unter Experten nicht so ganz sicher. Aber die Liste ist dennoch ein guter Anhaltspunkt um eine Idee zu bekommen, wie Google denkt rankt.

Den Stand der Dinge (15.02.2010) habe ich etwas weiter unten angehängt. Die einzelnen Faktoren (bitte auf die jeweilige Überschrift klicken sie zu sehen) habe ich nicht übersetzt, da die englischen Ausdrücke meist eindeutiger sind als deren Übersetzung. Faktoren die nicht selbsterklärend sind, habe ich versucht sinnvoll zu verlinken.

Ach ja, eines noch vorab: Diese Liste ist eine Sammlung von SEO Experten in einem Forum … und natürlich ist das alles nicht von Google bestätigt. Viele der Faktoren sind mehr oder weniger zu 100% bestätigt, viele aber auch nur Vermutungen (im speziellen die mit “(?)” gekennzeichneten sind mit Vorsicht zu betrachten).

  1. Domain age;
  2. Length of domain registration;
  3. Domain registration information hidden/anonymous;
  4. Site top level domain (geographical focus, e.g. com versus co.uk);
  5. Site top level domain (e.g. .com versus .info);
  6. Sub domain or root domain (?)
  7. Domain past records (how often it changed IP);
  8. Domain past owners (how often the owner was changed)
  9. Keywords in the domain;
  10. Domain IP;
  11. Domain IP neighbors;
  12. Domain external mentions (non-linked)
  13. Geo-targeting settings in Google Webmaster Tools

  1. Server geographical location;
  2. Server reliability / uptime

  1. URL structure;
  2. HTML structure;
  3. Semantic structure;
  4. Use of external CSS / JS files;
  5. Website structure accessibility (use of inaccessible navigation, JavaScript, etc);
  6. Use of canonical URLs;
  7. Correct HTML code (?);
  8. Cookies usage;

  1. Content language
  2. Content uniqueness;
  3. Amount of content (text versus HTML);
  4. Unlinked content density (links versus text);
  5. Pure text content ratio (without links, images, code, etc)
  6. Content topicality / timeliness (for seasonal searches for example);
  7. Semantic information (phrase-based indexing and co-occurring phrase indicators)
  8. Content flag for general category (transactional, informational, navigational)
  9. Content / market niche
  10. Flagged keywords usage (gambling, dating vocabulary)
  11. Text in images (?)
  12. Malicious content (possibly added by hackers);
  13. Rampant mis-spelling of words, bad grammar, and 10,000 word screeds without punctuation;
  14. Use of absolutely unique /new phrases.

  1. # of internal links to page;
  2. # of internal links to page with identical / targeted anchor text;
  3. # of internal links to page from content (instead of navigation bar, breadcrumbs, etc);
  4. # of links using “nofollow” attribute; (?)
  5. Internal link density,

  1. Website Robots.txt file content
  2. Overall site update frequency;
  3. Overall site size (number of pages);
  4. Age of the site since it was first discovered by Google
  5. XML Sitemap;
  6. On-page trust flags (Contact info ( for local search even more important), Privacy policy, TOS, and similar);
  7. Website type (e.g. blog instead of informational sites in top 10)

  1. Page meta Robots tags;
  2. Page age;
  3. Page freshness (Frequency of edits and
    % of page effected (changed) by page edits);
  4. Content duplication with other pages of the site (internal duplicate content);
  5. Page content reading level; (?)
  6. Page load time (many factors in here);
  7. Page type (About-us page versus main content page);
  8. Page internal popularity (how many internal links it has);
  9. Page external popularity (how many external links it has relevant to other pages of this site);

  1. Keywords in the title of a page;
  2. Keywords in the beginning of page title;
  3. Keywords in Alt tags;
  4. Keywords in anchor text of internal links (internal anchor text);
  5. Keywords in anchor text of outbound links (?);
  6. Keywords in bold and italic text (?);
  7. Keywords in the beginning of the body text;
  8. Keywords in body text;
  9. Keyword synonyms relating to theme of page/site;
  10. Keywords in filenames;
  11. Keywords in URL;
  12. No “Randomness on purpose” (placing “keyword” in the domain, “keyword” in the filename, “keyword” starting the first word of the title, “keyword” in the first word of the first line of the description and keyword tag…)
  13. The use (abuse) of keywords utilized in HTML comment tags

  1. Number of outbound links (per domain);
  2. Number of outbound links (per page);
  3. Quality of pages the site links in;
  4. Links to bad neighborhoods;
  5. Relevancy of outbound links;
  6. Links to 404 and other error pages.
  7. Links to SEO agencies from clients site
  8. Hot-linked images

  1. Relevancy of sites linking in;
  2. Relevancy of pages linking in;
  3. Quality of sites linking in;
  4. Quality of web page linking in;
  5. Backlinks within network of sites;
  6. Co-citations (which sites have similar backlink sources);
  7. Link profile diversity:
    1. Anchor text diversity;
    2. Different IP addresses of linking sites,
    3. Geographical diversity,
    4. Different TLDs,
    5. Topical diversity,
    6. Different types of linking sites (logs, directories, etc);
    7. Diversity of link placements
  8. Authority Link (CNN, BBC, etc) Per Inbound Link
  9. Backlinks from bad neighborhoods (absence / presence of backlinks from flagged sites)
  10. Reciprocal links ratio (relevant to the overall backlink profile);
  11. Social media links ratio (links from social media sites versus overall backlink profile);
  12. Backlinks trends and patterns (like sudden spikes or drops of backlink number)
  13. Citations in Wikipedia and Dmoz;
  14. Backlink profile historical records (ever caught for link buying/selling, etc);
  15. Backlinks from social bookmarking sites.

  1. Authority of TLD (.com versus .gov)
  2. Authority of a domain linking in
  3. Authority of a page linking in
  4. Location of a link (footer, navigation, body text)
  5. Anchor text of a link (and Alt tag of images linking)
  6. Title attribute of a link (?)

  1. Number of visits;
  2. Visitors’ demographics;
  3. Bounce rate;
  4. Visitors’ browsing habits (which other sites they tend to visit)
  5. Visiting trends and patterns (like sudden spiked in incoming traffic)
  6. How often the listing is clicked within the SERPs (relevant to other listings)

  1. Keyword over usage / Keyword stuffing
  2. Link buying flag
  3. Link selling flag
  4. Spamming records (comment, forums, other link spam)
  5. Cloaking;
  6. Hidden Text;
  7. Duplicate Content (external duplication)
  8. History of past penalties for this domain
  9. History of past penalties for this owner
  10. History of past penalties for other properties of this owner (?)
  11. Past hackers’ attacks records
  12. 301 flags: double re-directs/re-direct loops, or re-directs ending in 404 error

  1. Domain registration with Google Webmaster Tools;
  2. Domain presence in Google News;
  3. Domain presence in Google Blog Search;
  4. Use of the domain in Google AdWords;
  5. Use of the domain in Google Analytics;
  6. Business name / brand name external mentions.

Alle 200 Parameter (diese Zahl wurde unlängst von Matt Cutts während seiner Keynote Speech @ PubCon genannt) sind es dann doch nicht geworden, trotzdem gibt die Liste einen deutlichen Eindruck von der Komplexität der Rankingberchnung jenseits des Pageranks. Die Gewichtung der einzelen Faktoren ist natürlich offen und wird wohl immer ein gut gehütetes Geheimnis von Google bleiben.

Fazit

Suchmaschinenoptimierung (SEO) ist und bleibt ein äusserst komplexes Thema und diese Liste beweist einmal mehr dass SEO nicht aus ein “paar” wichtigen Dingen besteht, sondern es immer notwendig ist, das gesamte Spektrum an Faktoren zu beachten.

PS:

Ok, ich gebe zu, die Headline war etwas “catchy” aber bevor ich diesen Artikel geschrieben habe, hatte ich wieder einmal das “Vergnügen” mir eine der gratis U-Bahn Zeitungen anzusehen und irgendwie prägt das wohl noch für die nächsten 2 Stunden meine Schreibweise, wofür ich mich rückwirkend entschuldigen möchte ;-)

[/DDET]

Kommentieren: