Archive

Archive for the ‘WEB 2.0’ Category

Blog sites and search engines

2010-02-03 Komentarze wyłączone

Blog sites and pages indexed by particular search engines:
Google cache is searched by site:domainname. Yahoo is queried via linkdomain:domainname. Yandex is checked by typing search domain in advanced search.

Blogspot (blogger.com) is displayed in Alexa as world’s 7 most popular page, and 8 in USA. WordPress has Alexa rank 19. Livejournal is 82 in Alexa’s global ranking, but it has very high note in Russia: no 11 (most popular blog site in Russia, Ukraine and Belarus).

wordpress.com
google – 223 mln
yahoo – 64 mln
yandex – 280 тис

livejournal.com
google – 70 mln
yahoo – 53 mln
yandex – 49 млн

blogspot.com
google – 834 mln
yahoo – 188 mln
yandex – 21 млн

The results are quite interesting. The number of pages indexed by yandex for LiveJournal is almost as high as by google and yandex, where for blogspot and wordpress results are far behind. According to Yandex, 47 mln from 49 mln LiveJournal pages are in russian, which explains the results quite good.

There are quite few wordpress blogs which are indexed by yandex, and google search for given language doesn’t return the count. There is also a question, how good the search engines are at guessing blog language. I suppose that russian-language (or partially russian-language) blog has much more chance to be indexed by yandex beeing hosted on livejournal and not on wordpress. It is another thing on my list to check in free time.

There are some tricks to test for language tips for search engines. When defining language for page via meta content-language tag is not applicable (f.g. you can’t specify custom meta tags for particular pages) you can set lang property on span element. This tip is described in submit-site tips article on seo expert services.

Co zrobić gdy ktoś publikuje mój kanał RSS bez mojej zgody?

Ostatnio interesuję się problematyką pozycjonowania szukam na ten temat informacji w internecie. To, co znalazłem na licznych forach dyskusyjnych, było dla mnie wstrząsającym odkryciem. Pozycjonerzy opisują techniki, które w najlepszym przypadku znajdują się na granicy prawa, a większość z nich jest jego ewidentnym łamaniem.
Wyszukiwarki lubią treść, z angielskiego zwaną ‚contentem’. Najlepiej, żeby ta treść była sensowna, unikalna i było jej jak najwięcej. Jeśli komuś się nie chce samemu pisać albo płacić komuś za pisanie, sięga po cudze. Na forach opisane są techniki kopiowania całej zawartości witryn zawierających dużo artykułów i zastępowania słów ich synonimami aby uzyskać treść ‚unikalną’. Takie działanie jest ewidentnym łamaniem praw autorskich, ale ponieważ część słów została zmieniona, nie jest tak łatwe do wykrycia dla ofiar. Ponad 100 milionów autorów blogów publikuje ogromne ilości artykułów lepszej lub gorszej jakości. Większość z nich prawdopodobnie nigdy nie sprawdzała, czy ktoś nie skopiował ich twórczości. Kopiowanie takich serwisów jak Wikipedia to już jednak poważniejsza sprawa. Dlatego pewnie część nieuczciwych pozycjonerów znalazła sobie inny obiekt ataku.
Kanały RSS to sposób informowania czytelników o nowych artykułach w sposób wygodny dla obu stron. Najważniejsze silniki blogów, takie jak WordPress umożliwiają udostępnianie zawartości artykułów w formacie RSS. Z założenia RSS mają służyć do wyświetlenia ich w preferowanej przez użytkownika formie, na przykład w jego ulubionym programie pocztowym. A co ze stroną WWW, oferującą możliwość wyświetlania zawartości opublikowanej w postaci RSS przez innych? Strona WWW nie może być czytnikiem RSS? A co zrobić, jeśli ktoś publikuje czyjeś treści po to, aby ściągnąć ruch na swoją stronę i zarobić na reklamach lub podnieść swoją pozycję w wyszukiwarkach? Właśnie na rzekomy interes użytkownika chcącego przeglądać RSS przez witrynę WWW powołał się autor jednego z komentarzy w artykule o nieetycznym pozycjonowaniu na jednym z blogów o SEO.

Autor innego bloga shwsite twierdzi w swoim artykule Wybiorcze prawa autorskie, że umieszczanie artykułów opublikowanych przez kogoś w formacie RSS jest legalne. Ma to wynikać z idei RSS, jaką jest dostarczanie treści, która może być wyświetlana przez użytkownika w dowolnej postaci.
Takie stanowisko niezbyt do mnie przemawia. W końcu HTML też może być wyświetlany w dowolnej postaci. Standard HTML/CSS przewiduje, jak mają być wyświetlane poszczególne znaczniki, jednak standardów nikt w pełni nie przestrzega. Treść z kanału RSS może być po prostu w sposób ładny i jednoznaczny wyłuskana, a w przypadku HTML nie jest jednoznaczne, co jest treścią, co jest tytułem, a co nagłówkiem lub spisem treści.
Z drugiej strony, można się powoływać na intencje autora. RSS można pobrać na swój komputer i czytać nawet bez fizycznego dostępu do internetu. Opublikowanie cudzego RSS na swojej stronie miałoby oferować użytkownikowi to samo, co jego program pocztowy? Jest jednak jedna zasadnicza różnica: użytkownik korzysta ze swojego programu pocztowego we własnym zakresie, a informacja umieszczona w serwisie WWW jest indeksowana przez wyszukiwarki, generuje ruch, robi reklamę serwisowi i może być źródłem dochodu dla jego właściciela. Jeśli ktoś zarabia na czyjejś twórczości, powinien za to zapłacić jej autorowi, chyba że ten się zrzekł zarobku.

Odmienną opinię znalazłem na forum prawnym w wątku Wykorzystanie treści z kanałów RSS na swojej stronie. Internauta wyraził stanowczo opinię, że treść opublikowana za pomocą kanału RSS podlega takiej samej ochronie, jak każda inna publikacja. Jej dalsza publikacja jest możliwa tylko pod warunkiem uzyskania zgody autora lub zgodnie z prawem cytatu. Opinia ta brzmi znacznie bardziej przekonywująco, stosuje bowiem dla kanałów RSS te same reguły, co dla każdego innego przejawu twórczości.

Osobiście przychylam się do opinii, że każda publikacja cudzej twórczości na własnej stronie wymaga zgody jej autora, za wyjątkiem przewidzianych w prawie wyjątków, takich jak prawo cytatu i przepisy o informacji prasowej. W sytuacji braku przepisów szczególnych dotyczących kanałów RSS sąd powinien zastosować analogiczne przepisy dotyczące praw autorskich do publikacji. Tak naprawdę jednak dopiero wyrok sądowy w tej sprawie dałby jasność, jak należy traktować takie przypadki. Po procesie wygranym przez autora, którego prawa autorskie zostały naruszone, posypałaby się pewnie lawina pozwów w podobnych sprawach.
Jeśli ktoś ma informację o procesie sądowym dotyczącym nieautoryzowanego publikowania kanałów RSS na własnej stronie, proszę o kontakt ze mną lub zamieszczenie odpowiedniego linka w komentarzu do tego artykułu.

About communicators…

2009-09-20 Komentarze wyłączone

Before internet era one thing was easier for companies: in order to be reachable a company should have its own postal address and phone. Since each company must be registered under some address, the first is quite obvious. The phone number was also no problem – each company needed it anyway. At the begin of internet an e-mail arised – and also companies had quickly got used to it.

However, internet era has begun its second phase – Web 2.0 – and now things are no more so obvious.
Phone system is unified. If you have a phone, no matter what country on the world, no matter what telecommunication company – you can call any other phone owner. E-mail is also unified. You must only know your partner’s e-mail address and you can e-mail him from any of your e-mail accounts. But Instant Messaging have arised – and we don’t have here unification more.

You can ask” ‚Sso what. I have phone that works perfectly fine for me, I have e-mail that works perfectly fine for me, anyone who wants to can reach me.’ Well, you are right that anyone can reach you if he wants, but he may not prefer to contact YOU because someone other is… better available for him.
Internauts fell in love in instant messaging (IM). Communicators and chats are something between e-mail conversation and phone conversation. They are faster than e-mail. With e-mail you must wait until someone will check his mailbox, and he doesn’t know that somebody writed to him until he do the check. With phone the other party will be immediately notified, however you can answer only one phone call at the time, and phone call is 100% engaging. IM gets the other immediately notified, you can chat a lot of people in one time and is moderatly engaging (as engaging as you let it to be). Do you imagine calling someone via phone and not waiting until he answers because you are impatient and prefer to check gossips on yahoo? Well, IM’s such behaviour is nothing special. This is the way the IM users like to communicate, if you tell then to phone you they will not be comfortable because they don’t want to be 100% engaged by phone call, if you tell them to e-mail you, they will not be comfortable because e-mail gives no possibility to ‚push’ you to answer. And IM users are quite large group, as business owner you propably won’t like to ignore them.

So the best you can do is to make yourself available for IM users. Sounds easy? Well, don’t worry, it’s not. There are a lot of IM communicators and they are not unified. ICQ users can reach other ICQ users but not Jabber users or AOL users. There’s also skype, which can be used for both IM and free VoIP calls. For worse, there are regional communicators, which are more popular than mentioned above (for example, GG is polish IM, most popular in Poland). There are also modified mutations of standard protocols (f.g. closed, modified versions of Jabber protocol, such as polish Tlen). So bad news is, that if you want to encourage more people to communicate with you (increasing your sales target) you must install a lot of communicators and spend some time on creating IM accounts. It’s similar to the situation with social networking portals.