Skip to content

blog.ch spinnt!

Vor einer Stunde ist mir aufgefallen, dass einige Beiträge auf der Startseite doppelt erscheinen. Und jetzt um 10:05 war es auch wieder der Fall. Ganz schön merkwürdig! Werde der Sache in der Mittagspause nachgehen, wenn die Kleinen schlafen.

Also mal schon sytematisch vorgehen:
1. Einige “böse” Feeds isolieren – OK
2. “Böse” Feeds überprüfen – OK
3. “Böse” Feeds mit dem Script abholen, Abgleich mit DB – OK

Also wo zum Geier ist das Problem?

5 Comments

  1. Gute Frage. Ein Entry von mir kam auch einmal doppelt, nachdem ich einen Tippfehler im Titel korrigiert hatte. Ist vielleicht ein Hint.

    F.

    Thursday, December 1, 2005 at 16:24 | Permalink
  2. Matthias wrote:

    Ja, das habe ich zuerst auch gedacht. Da nicht jede RSS-Version Zeitangaben enthält, schliesse ich Duplikate aus, indem ich aus aus Titel und Permalink den MD5 in die DB eintrage und jeweils vergleiche. Wenn sich der Titel ändert, wird ein Beitrag deshalb doppelt eingetragen (kommt selten genug vor). Aber das ist hier nicht das Problem, die Beiträge sind vollkommen identisch.

    Hmmm… ist ein MD5 String immer 32 Zeichen lang?

    Friday, December 2, 2005 at 08:45 | Permalink
  3. chregu wrote:

    ja, hexencoded ist ein md5 string immer 32 zeichen lang.

    Friday, December 2, 2005 at 09:25 | Permalink
  4. Matthias wrote:

    Danke, chregu! vielleicht kommt die DB nicht mehr mit, wenn sie so viele SELECT Statements machen muss? Obwohl, sooo viele sind’s ja nun wirklich nicht. Werde mal in phpmyadmin schauen, was passiert.

    Friday, December 2, 2005 at 09:47 | Permalink
  5. Matthias wrote:

    Brachialmethode: Ins SELECT-Statement für den Output der Beiträge einfach GROUP BY title (alternativ GROUP BY permalink) einfügen. Sollte funktionieren, oder?

    Friday, December 2, 2005 at 10:19 | Permalink

One Trackback/Pingback

  1. The Blog.ch.Blog » Blog Archive » Mit Gewalt gehts! on Saturday, December 3, 2005 at 10:20

    […] The Blog.ch.Blog « blog.ch spinnt! […]