Inlägg som raderats och statistik

En ny kontroll av inlägg som raderats införs idag. Normalt sett skall en blogg (kan man tycka) lämna en ”404 File not found”, när ett inlägg inte längre finns på websidan. En del bloggar fungerar så, till RSSWatch stora glädje; när ett inlägg raderas rapporterar websidan tillbaka att inlägget inte längre finns och det flaggas som raderat. För besökaren syns detta sedan i rubriken för varje inlägg, med en rödfärgad överstruken titel. Det är dock inte alla bloggar som fungerar på det viset, utan rapporterar tillbaka statuskoden ”200 OK” trots att inläggen inte längre existerar. Det är naturligtvis irriterande eftersom RSSWatch inte kan skilja inläggen åt – bloggarens rssfeed säger ju att inlägget finns.

Detta är dock löst, genom att RSSWatch i realtid räknar antalet inkomna kommentarer. När en kommentar raderas flaggas det automatiskt som raderat och RSSWatch håller då reda på både vilka kommentarer som finns synliga på en blogg och vilka som är raderade. Om samtliga kommentarer flaggats som raderade så kan det alltså bara betyda två saker: Bloggaren har fått ett frispel och raderat alla kommentarer manuellt – eller raderat inlägget. RSSWatch utgår från att det är inlägget som är raderat.

Utöver detta så har RSSWatch nu berikats med statistik över de bloggar som lagts till i registret. Detta kan beskådas här: http://fnarg.org/rsswatch/stats

RSSWatch-2.0

RSSWatch byggs om från grunden och blir version 2.0! Diffutils byts ut mot en snällare variant så att även vanliga människor kan läsa och förstå förändringar som gjorts i inlägg och kommentarer. RSSWatch är nu i princip självgående. Folk har till och med nytta av sidan!

RSSWatch-1

Version 1.0 – Beta

RSSWatch startar som ett testprojekt. Projektet stödjer engelska och svenska och småfunktioner med rättelser läggs till efterhand. Inlägg snappas upp och distribueras på rad – senaste ändringarna i rsslänkar visas upp med hjälp av Gnu Diffutils. Mitt under projektets gång, några dagar senare skapas kommentars-crawlern, då behovet från ett fåtal besökare finns.

Version 1.0.1

RSSWatch byggs ut, för att inte den gamla sidan skall sluta fungera byggs den som version 1.0.1 och en chatt dyker samtidigt upp. Varför är det inte riktigt någon som vet. Att inlägg och kommentarer börjar bli skakigare av den ökande mängden från crawlern blir märkbar och rättas till ytterligare.

Under tiden har flera saker hunnit rättas och som en sann utvecklare finns också en changelog dokumenterad, dock utan tidsmarkeringar…

  • Incorrect titles for some blogs (shortnames)
  • Connect the chat to IRC
  • Chat
  • CommentIsDeleted-Detector can’t find comments on some wordpressblogs (if we need to rescan a blog, please tell us)
  • Userfriendlier interface
  • Try to find deleted comments (Request by users, where instead of manipulations, posts are deleted)
  • Line breaks in comments
  • Faster updates, solved with forked feedscan
  • Scanner for duplicate comments that is actually identical
  • Some issues with logging, some comments and posts may unfortunately possibly have been lost