pub-sub

Ostatnio na Joggerze dużo się pisze o RSS, jak to wygodnie przeglądać w
ten sposób newsy z różnych źródeł. Ale to przecież dalekie od ideału… Po
pierwsze i tak trzeba znać źródła informacji którą się chce uzyskać, po drugie
oprogramowanie musi co chwilę sprawdzać, czy nowa informacja się pojawiła.
Pojawia się więc myśl, że fajnie by było jakbyśmy byli informowani jak
oczekiwana przez nas informacja się gdzieś pojawi.

Właśnie podczas czytania jednego z takich wpisów o RSS przypomniałem sobie
o pubsub. I mam na myśli właściwie dwie rzeczy. Jedna to protokół
pubsub
rozszerzenie XMPP rozwijane przez JSF (możliwe, że opowiem o tym na
najbliższych Pingwinariach), drugie to PubSub.com serwis pozwalający subskrybować
informacje jakie nas interesują, niezależnie od źródła. Zresztą, PubSub.com wykorzystuje technologię pubsub dla XMPP.

Jak sobie przypomniałem, że coś takiego istnieje, to postanowiłem
spróbować. Okazało się to prostrze niż mogłem przypuszczać. Po prostu
wystarczy wejść na stronę PubSub.com
i wpisać swoje zapytanie (podobnie jak do wyszukiwarki internetowej), a
następnie już tylko czekać aż pojawią się (np. w postaci feedu RSS, albo po
prostu strony HTML) pierwsze informacje do niego pasujące. Można też założyć
sobie konto — wtedy nad swoimi subskrypcjami ma się większą kontrolę,
a ich lista nie jest związana z jedną przeglądarką. Można też zainstalować
sobie PubSub sidebar for Firefox (dla IE też jest), który
będzie pokazywał interesujące nas informacje na bierząco. I tu pojawia się
XMPP (rdzeń współczesnego protokołu Jabbera) — ten sidebar to nic
innego, jak prosty klient XMPP z obsługą
pubsub.

Dla siebie stworzyłem zapytania o Pythona, XMPP/Jabbera i o siebie (żebym
od razu wiedział, jak ktoś mnie w sieci obsmarowuje 😉 ). Na temat pythona
dostaję całą masę wiadomości i już trafiłem na jeden ciekawy artykuł:
Python
optimization tips
. O Jabberze jest nieco mniej (między innymi, że jakiś
serwis uznał XMPP za słowo dnia). Pozostałe zapytania nie
pokazały na razie nic. W każdym razie serwis wydaje się interesujący. Nie mogę
się tylko doczekać kiedy mój klient Jabbera będzie umiał pubsub (wiem, wtedy gdy
sobie to napiszę), a PubSub.com udostępni
swoje usługi dla serwerów z zewnątrz (teraz, zdaje się, jest tylko dostęp
z klientów podłączonych bezpośrednio do ich serwera).

Hacker też człowiek

Dzisiaj dodałem sobie do Joggera hacker emblem, a teraz chciałem
zobaczyć kto jeszcze tego używa, więc wpisałem do Googla:
link:http://www.catb.org/hacker-emblem/. Otworzyłem parę
pierwszych stron i od razu
jedna z nich
mnie zainteresowała. Blog jakiegoś hackera
piszącego o seksie. Nawet mądrze i ciekawie (na razie przeczytałem jeden wpis).
Spojrzałem na URL — esr w środku, wpisy też podpisane ~esr.
Myślę sobie: Czyżby to ten ESR? Nieee…. Kliknąłem więc
webhome i jednak tak — to jest Eric S. Raymond. Jeden z
najsławniejszych hackerów i twórca (a może tylko opiekun) hacker emblem, który zresztą
ostatnio był kilkukrotnie cytowany na Joggerze.

A mnie się wydawało, że znani hakerzy piszą tylko na nudne tematy takie jak
polityka, czy filozofia. Inna sprawa, że na blogu ESR ostatni wpis na temat
seksu jest z października zeszłego roku, a ostatnie wpisy (styczeń, luty b.r.)
są o… polityce (błe).

[‚] [‚] [‚] dla Pstryczki

Pstryczka umarla. Wlasciwie to nigdy nie istniala. To przeczytałem na
stronie, która do niedawna była blogiem Pstryczki.
Bardzo lubiłem czytać tego bloga. Nie tylko dlatego, że Pstryczka świntuszyła
(inne nieprzyzwoite blogi szybko mi się znudziły), ale dlatego, że był bardzo
dobrze napisany i pełen ludzkich uczuć. Wierzyłem (z pewnym marginesem —
jednak w Internecie niczego nie można być pewnym), że większość co tam było
opisane to prawda. Sam nie chciałbym tak żyć, ani nie chciałbym, żeby taka była
moja żona (chociaż niewiele nam brakuje…), ale lubiłem Pstryczkę.

Nie wszystko w blogu pstryczki było zmyślone. Część zdarzeń była wzięta wprost z
życia autorki. I to je (Pstryczkę i autorkę) zgubiło. Opisywanie przygód
seksualnych razem z planami adopcji dzicka to był błąd. Niestety skończył się
tragicznie dla Pstryczki — bo przestała istnieć —, dla autorki i jej
męża — bo nie adoptowali oczekiwanego dziecka — i dla dziecka, bo
nie doczekało się nowych rodziców. Wierzę, że naprawdę dobrych rodziców.

Przykro mi, że bloga Pstryczki już nie będzie, że się skończył. Ale podobne
uczucie mnie ogarnia na końcu każdej dobrej książki. Nic nie trwa wiecznie.
A ja trzymam kciuki za autorkę. Niech adoptuje to dziecko. Należy jej się!

P.S. jpc — teraz możesz napisać A nie mówiłem? ;-)

Świntuchy dwa

Znaleźliśmy z żoną miły sposób na spędzanie samotnych wieczorów – gdy Ona
jest w Bochni, a ja w Gliwicach: czytanie nieprzyzwoitych blogów – niektóre
są naprawdę niezłe (blog.pl i blog.onet.pl to jednak nie takie całkiem
bezwartościowe serwisy). Ja je wyszukuje, a jak znajdę coś ciekawego podsyłam
linka. Najwyraźniej jej też się to podoba. Kiedyś będziemy musieli sami
spróbować czegoś z tego co przeczytaliśmy. :-)

Zastanawiam się czy nie podlinkować co ciekawszych z tych blogów do mojego
Joga, ale co by sobie ludzie (którzy mnie jeszcze nie znają z tej strony) o mnie
pomyśleli. ;-)

Szkodnik polskiego WWW zdemaskowany

Chcąc trochę polepszyć pracę naszego proxy zagłębiłem się w jego statystyki.
Okazało się że najwięcej przetwarzanych żądań dotyczy *.hit.gemius.pl (10% całego ruchu), przy czym nie są one w ogóle keszowane (0.06% trafień w cache).

Każde załadowanie strony na onet.pl, interia.pl itp. wiąże z połączeniem nie tylko z wybranym serwerem, ale także z którymś z serwerów *.hit.gemius.pl – z punktu widzenia użytkownika to drugie połączenie jest zupełnie niepotrzebne, a może opóźnić załadowanie całej strony.

Ja rozumiem – badania internetu. Ale czy nikt nie słyszał o badaniach przesiewowych? Gdyby badania dotyczyły co setnego połączenia, to przecież wyniki wcale nie byłyby dużo gorsze, a koszt znacznie mniejszy. Ale w końcu to koszt użytkownika – kto by się z tym liczył?

A genialność twórców tego systemu (a przynajmniej programistów) potwierdzić może ten link: http://onet.hit.gemius.pl/. Normalnie odwołania są razem z jakąś ścieżką (za każdym razem inną), ale bez ścieżki efekt jest najciekawszy ;-)

Zastanawiam się jak oszczędzić użytkownikom (i naszej sieci) tych niepotrzebnych połączeń. Wyciąć tego po prostu na proxy nie mogę – byłaby to cenzura i ktoś mógłby się słusznie doczepić (nawet jeśli wycinam tylko spyware). Ale jak dam użytkownikom opcję „przyspiesz swój internet”, z opisem na czym to polega (nie ważne że nikt nie zrozumie), to już chyba byłoby OK…

Do przemyślenia

Ciekawego linka ktoś wkleił dzisiaj na jdev@conference.jabber.org:
http://www.joelonsoftware.com/articles/fog0000000069.html

Nie wiem co o tym myśleć. Z jednej strony mądrze piszą i do tego bardzo pocieszająco (mój kod nie jest taki zły :-)), ale z drugiej… nie do końca jestem przekonany że pisanie od nowa nigdy nie ma sensu. A na tę konkretną sprawę można spojrzeć inaczej: może Netscape wyrzucił swój stary kod, ale ekipa Mozilli po prostu zrobiła swoją przeglądarkę od zera. A to już chyba takie naganne nie jest.

Brat publikuje, he he

Dowiedziałem się wczoraj że mój brat publikuje w Internecie. Wiersze.
Dzisiaj postanowiłem to obejrzeć – mało mnie obchodzi co on robi, ale
ponabijać się mogę. Pisemko w którym publikuje to Experyment (ni to po polsku,
ni po angielsku, ale przecież „x” rulez!) pod pseudonimem „artystycznym”
MacieK. Widać że webmaster serwisu (możliwe że admin całego friko.pl
też) chyba nie ma pojęcia co to HTML (validator.w3.org nawet nie
pokazuje błędów – w ogóle tego nie łyka, pewnie dlatego że strona
zaczyna się od <SCRIPT>). Kodowanie znaków oczywiście windows-1250, bez
deklaracji. W sumie dziwne że w ogóle zawartość da się czytać. Co do
samych wierszy to się nie znam, ale osobiście wolę te, które pojawiały się na
joggerze 🙂

Pewnie zastanawiacie się po co to piszę. Sam nie wiem. Chyba dlatego,
że dawno nie miałem okazji się z brata ponabijać. A lubię to – w końcu
ja mam umysł ściśnięty, a on humanista 🙂 No i dobry uczynek zrobię
– magazyn będzie miał więcej punktów w Google (o ile Google indeksują
joggera) 🙂

Koszmar XML w pythonie o raz inne duperele

Chciałem wczytać plik XML, zwalidować go zgodnie z pewnym DTD,
przetwarzać poprzez API DOM i wypluć uzupełniony. Nic specjalnego. To co
jest załączone w pythonie (minidom) ani nie waliduje, ani nie potrafi
ładnie wypluć (taki pretty-print z wcięciami itd.). Jest też PyXML. Ma
kompletny DOM, z PrettyPrint oraz parser walidujący – można użyć
albo jednego, albo drugiego. Dwa razy tego samego pliku
parsować nie mam zamiaru – walidację sobie odpuściłem. Do tego doszedł
jeszcze jabber.py z własnym parserem i niby-DOMem. 😦 A mogłoby być tak
pięknie – python to wspaniały język, tylko coś porządnej biblioteki
dorobić się nie może.

Transport GG po ostatnich przeróbkach mi się wywala. Ale oczywiście
nigdy pod gdb. To znaczy raz mi się wywalił pod gdb i jeden głupi błąd
poprawiłem, ale wywala się nadal.

Córeczka właśnie się drze z krzesła. Nie mam pojęcia jak na nie
wlazła… Wcześniej przeglądała (z bardzo mądrą miną) „Układy
półprzewodnikowe” Tietze’a i Schenka. Czy nie za szybko ona nam
dorośleje (przypominam ma roczek).

Znalazłem dzisiaj też coś dla wszystkich co się uważają (tak jak ja)
za nerdów i/lub geeków. Przeczytajcie kto to:
nerd
i geek.
Szczególnie pierwsze znaczenie (w obu przypadkach) oraz trzecie (w
przypadku geeka) jest ciekawe 🙂 .