태우's log - web 2.0 and beyond

시맨틱웹, web 2.0, 플랫폼경제, 그리고 정보원자론


11/4/2005

더 좋은 검색엔진을 바라는 이유

Filed under: — twdanny @ 12:20 am

몇일전부터 LCD 모니터가 이상하다.
디폴트 해상도가 1280 * 1024인데, 자꾸 1024*768을 해야 화면이 딱 알맞게 차면서 뿌옇게 나오고, 1280 * 1024로 다시 맞추면 화면이 모니터의 화면을 넘어가서 마우스를 쭉 잡아 당겨야만 코너로 갈 수 있는 상황이 발생한다. (참고로 LCD는 기본 해상도 아래의 해상도로 맞추어 놓으면 상이 흐려진다). 그래픽 카드를 다시 설치해도 마찬가지이고, 모니터를 껐다 켜봐도, 초기화를 해도 모두 마찬가지이다. 리눅스로 재부팅을 해봐도 역시 마찬가지.

너무 불편해서 답을 찾기 위해서 “양질의 컨텐츠"가 많은 웹에서 찾기로 했다. 제일 먼저 구글로 가서 알아보려고 하는 순간 머리에 문득 드는 생각이 “뭐라고 쳐야지?". 정말로 뭐라고 쳐야되는지를 몰랐다. 그래서 LCD, 해상도, 드라이버, 모니터 최적 등의 키워드를 번갈아 조합해 가면서 조회를 해봤으나 결국 아무데서도 원하는 답을 찾을 수가 없었다. 네이버, 엠파스, 야후, 첫눈, 심지어는 AskJeeves도 모두 마찬가지. 원하는 답을 찾을 수가 없었다.

문제는 바로 검색엔진의 희망 질의어가 아직은 중요 개념 위주로 구성되어 있다는 점이다. 이 개념들이 연결되기 시작하였을 때를 그렇게 잘 처리하지는 못하는 것 같다. 그렇기에 우리에게 있어서 아직도 “검색후 브라우징"은 필수 활동이다. (물론 구글에서는 이 활동을 최소화하기 위해서 feeling lucky를 추가했겠지..) 좀더 철학적으로 들어가보면, 우리가 알고 있는 상황이나 두뇌속의 하나의 개념을 어떤 표현으로 나타낼 수 없는 경우가 너무 많다. 그 대표하는 ‘기호’를 찾을 수가 없는 것이다. 그런 상황에서 우리는 장황한 설명을 늘어놓게 된다. 반대로, 우리가 오감을 통해서 자연적으로 인식하게 되는 개념들은 아무런 설명이 필요가 없다. 오히려 그것을 설명을 하는 것이 우리에게는 더 괴로운 일이다. 다음은 우리가 단 한번에 느낌으로 아는 ‘red’라는 단어의 Dictionary.com의 정의이다.

The hue of the long-wave end of the visible spectrum, evoked in the human observer by radiant energy with wavelengths of approximately 630 to 750 nanometers; any of a group of colors that may vary in lightness and saturation and whose hue resembles that of blood; one of the additive or light primaries; one of the psychological primary hues.

ㅡ,.ㅡ;

하여튼. 이런 문제들 때문에 아직도 검색엔진이라는 것은 걸음마 단계에 있다고 할 수 있다. 일단 눈앞에 보이는 것만 나열해 보자면, 1) 웹상의 자료가 구조화되면서 (시맨틱웹, Microformats 등), 2) 인공지능, 특히 자연어 처리 (NLP) 부분이 발전할 수록, 3) 좀더 대용량의 정보를 쉽게 다룰 수 있는 기술이 발달하면서, 4) 멀티미디어 자료 검색이 쉬워질 수록, 5) 웹상에 존재하는 보이지 않는 수많은 메타데이터가 아름다고 검색으로 녹아들어가면서, 검색은 혁명적으로 발전할 것으로 기대한다. 언젠가 인터넷 역사 박물관이라는 것이 생겨서 “구글 방"이 생기면, 아무 것도 없는 화면에 자그마한 검색 텍스트 박스 하나만 있는 것을 보면서 웃는 날이 오지 않을까?

(참고로 저의 질문에 답을 아시는 분은 코멘트 와이드 오픈입니다. ㅠㅠ)

10/12/2005

del.icio.us 전문가 랭킹

Filed under: — twdanny @ 12:36 am

likejazz님의 소개를 통하여 찾게된 CollaborativeRank. 자세한 랭킹 방법과 Expert 정하기 등은 likejazz님의 글을 참조하시도록.

아무래도 랭킹이 궁금하여 검색을 해보았더니, 입 딱 벌어질 2220등이라는 랭킹이 나왔다. 뿐만 아니라, 각 분야에 대하여 다음과 같은 랭킹이 나왔다.
delicious ranking
[Figure 1] 태우의 분야별 del.icio.us 전문가 등수

말도 안 돼!

일단, 첫째로. 내가 ‘Cuban’의 1등 전문가라고? ㅡ.ㅡ;;
여기서 잠시. Mark Cuban은 90년대 말 broadcast.com 이라는 도메인을 야후에 57억불(환율 1000원 계산으로 5.7조원!!!) 에 인수한 억만장자이며 지금 현재는 HDNet를 운영하고 있으며, P2P/저작권관련에 한 획을 그은 Grokster case에서 Grokster를 후원하였으며, 내가 사랑하는 NBA의 팀 중 달라스 매버릭스의 owner이다. (참고로, 나는 현재 8년째 마이애미 히트의 팬이다.) 뿐만 아니라, 현재 내가 즐겨 읽고 있는 Blog Maverick에서 멋진 블로깅 활동을 펼치고 있다. Blog Maverick은 얼마전에 AOL에 의해 인수된 WeblogsInc.의 블로그 중 하나이다.

하여튼. 물론 나의 관심이 Long Tail TV, NBA, P2P, podcasting 이런 것들에 있는 것은 사실이지만, 내가 ‘Cuban’ 1등 전문가라고? ㅡ.ㅡ;; 내가 무슨 스토커도 아니고. 희한한 일이다. 일단, 전체에서 1등이 하나라도 있으니 CollaborativeRank 팀에게 감사. (ㅡ ㅡ) (_ _) (ㅡ ㅡ) 이 결과를 보고 Mark Cuban한테 빨리 연락이나 와서 그가 내 블로그를 그에게는 껌값인 4000만원의 열배 정도인 4억에 사주기를 바란다. ㅎㅎ

다음은 SPARQL. SPARQL은 전에도 소개한 적 있지만, 시맨틱웹에서 사용되는 SQL의 select구문과 같은 용도의 프로토콜이다. 즉, 웹상에 여기저기 널리 퍼져있는 RDF 데이터들을 원하는 조건으로 검색하여 찾아내는 것. 어쩌다 3등이 되었는지는 모르겠지만, 이것 또한 영광이다.

다음은 journalism (9), media(16). 사실 위의 1, 3등보다 여기서 9등과 16등을 한 것이 내게는 훨씬 기쁜 일이고 큰 영광이다. 물론 어느 정도의 관심분야이기는 하지만, 이 분야는 내가 감히 고개를 들 수도 없을 정도로 세계적인 권위와 전문가들이 즐비한 곳인데, 어떻게 이런 높은 랭킹에 오를 수 있었을까? 물론 내가 즐겨서 북마크하는 글들이 이 분야에 있어서 매우 진보적이고 미래지향적이며 앞으로 영향력이 클 가능성이 높은 글들임을 인정한다. 하지만, 사실 그 이유를 대보자면, 아무래도 내가 아주 조아라 하는 Jaff Jarvis, Jay Rosen, Steve Rubel, Tom Coates, Dan Gillmor 이런 블로거들이 소개하는 링크를 자꾸 북마크 하다보니 그렇게 되었다고 보는 것이 더 정확하다. 참고로 위 다섯명은 Technorati에서도 Media에 관한 최고 권위 11명으로 뽑히는 언론과 미디어 쪽에서는 아주 영향력있고 저명한 블로거들이다. 유명한 블로거들 뒤에서 그림자만 밟아도 이런 영광을 누릴 수 있다는 것이 Web 2.0의 멋진 점 중 하나가 아닌가 하는 생각이 문득 들었다. ^^;

내가 왜 technorati 전문가인지는 전혀 모르겠다. 그것도 21위. 아마 내가 북마크했던 글 중에 알게 모르게 결국에는 테크노라티와 관련된 글이 많이 있었나 보다. semantic은 아마도 시맨틱웹에 관한 글들 때문이었을 것이고, 그외에 weblog/blogging/tagging 역시 technorati와 비슷한 이유가 아니였을까. 아마 news는 media/journalism.

여기서 재미있는 사실은 내 del.icio.us를 보면 알겠지만, 위에 있는 분야들 중에서 내가 직접 태깅을 한 것은 “tagging"이라는 태그 하나 밖에 없다는 사실이다. ㅡ.ㅡ;; (이것은 isanghee님도 마찬가지) 오늘로서 200개를 넘긴 “web 2.0″이라는 태그는 아쉽게도 전혀 등수안에 들지 못했으며, 그 뒤를 바싹 쫓고 있는 “newmedia"는 아무래도 media/journalism으로 흡수된듯 하다. 물론 이 랭킹 시스템을 얼마나 정확히 믿어야할지는 모르겠지만, 이는 del.icio.us를 적극적으로 사용한지 그리 오래되지 않은 나의 관심분야가 web 2.0의 기술적인 분야에서 점차 ‘新미디어 경제’라는 분야로 옮겨가고 있는 것을 보여주는 듯 하다. 그리고 이 분야에서 더 “전문가"로서 인정을 받았으니 나름대로 크게 기뻐할 일이라고 보고 있다.

웹 2.0 세계에서는 전체 등수는 사실 그리 중요하지 않다. 위의 블로거들이 말하기를 전체등수는 규모의 경제를 중요시 하는 20세기, 웹 1.0 식 사고방식이라고 하더라. 중요한 것은, 내가 관심있는 분야에서 내가 어떤 위치에 있는가라는 것이다. 이는 지난 여름에 한참 떠돌던 Technorati 100 Blogs가 얼마나 의미가 없으며 가장 중요한 것은 ‘my favorite 100 bloggers’라고 하던 의견과도 일치한다. 오늘 이 결과를 통해서 나는 나의 관심사가 무엇이었었는지를 배울 수 있었으며, 또한 그 각분야에 대해서 상대적으로 나의 위치가 어느 정도되는가를 배울 수 있었다. 나의 개인적인 attention 이 노출된 것에 대한 염려는 적지 않지만, 이런 서비스를 제공해준 CollaborativeRank 팀에게 다시 한번 감사. 그리고 likejazz님께도 다시 한번 감사.

p.s. 힌트로, 위에서 만약에 del.icio.us 랭킹을 많이많이 높이고 싶을 경우에는 가장 영향력 있는 블로그들 (Winer, Scoble, Ito, BoingBoing 등) 을 찾아서 여기서 소개되는 글들을 죽어라고 북마크에 추가하면 된다. 그렇게 하다보면 언젠가 자신도 모르게 전문가가 된 자신을 발견할 수 있을 것이다. 물론, CollaborativeRank의 랭킹과 현실의 랭킹이 거리가 있을 수는 있지만.

10/3/2005

G마켓이 제일 먼저 치고 나가는군요.

Filed under: — twdanny @ 8:36 pm

뉴스와이어 - G마켓, 쇼핑몰 최초 RSS서비스 오픈 (via hof님)

얘기 처음 꺼낸 후로 대략 8개월 정도 걸린 것 같네.

내 생각에는, 지고 못 버티는 경쟁사들 곧 따라서 RSS 서비스를 시작하지 않을까?

소비자 천국이 다가오고 있다!! ㅋ

9/15/2005

Google 블로그 검색 엿보기

Filed under: — twdanny @ 12:58 am

google blog search
[Figure 1] Google 블로그 검색에서 “웹 2.0″으로 검색해본 결과. 1위는 연욱님의 웹 2.0에 대한 파드캐스트. 그외의 대부분의 글은 태우’s log에서 왔다.

구글에서 블로그 검색 서비스를 개시했다. Technorati, PubSub, IceRocket, Feedster 등의 작은 검색 엔진에 뒤에서부터 도전장을 던진 것이다. 베타 서비스이기 때문에 아직은 부족한 부분이 많겠지만, 구글의 검색기술과 방대한 DB를 바탕으로 봤을 때 또 새로운 장을 열게 되지 않을까 한다.

일단 주목할 점은, 구글 블로그 검색은 블로그 포스트 각각의 HTML 페이지 검색이 아닌 RSS 피드 검색이라는 점이다. 이러한 검색 방식의 가장 좋은 점은 각 포스트가 이미 RSS/Atom 스키마에 따라서 정형화 되어있기 때문에 더 정교한 결과를 위한 처리가 가능하다는 것. 반대로 단점은 무엇보다도 full-text 피드가 아닐 경우, 또는 피드 자체를 제공하지 않는 블로그일 경우에 많은 부분을 놓칠 수 밖에 없다는 것이다. 뿐만 아니라, 구글 feed robot이 피드들을 긁어모으기 시작한 것보다 이전의 포스트들은 현재 피드에 존재하지 않으므로, 그 이후에 찾은 것만 찾을 수 있다는 것 역시 커다란 단점으로 작용한다. 자세한 것에 대해서는 구글 블로그 검색 FAQ를 참조하기를. (참고로, 구글이 full-text 피드를 검색하고 필요에 따라 결과를 보여주는 것과 RSS에 대한 인식이 전에 비해 훨씬 널리 퍼진 것을 보면 이제는 슬슬 RSS넷과 연모도 full-text 를 보여줘도 충분히 사용자들의 공격을 아름답게 피해갈 수 있을듯 한데 ㅋㅋ)

추석기간 동안에 쓰기로 계획하고 있는 “보이지 않는 검색 엔진들"이라는 글에서도 다시 다루겠지만, 구글이 블로그 검색에 나섰다고 해서 반드시 위에서 언급한 “작은” 검색 엔진들이 겁먹을 필요는 없다. 지난 번 참석했던 첫눈 간담회 자리에서도 많은 사람들이 공감을 했던 부분이지만, 이미 검색이라는 것은 단순히 ‘내가 원하는 키워드와 관련된 문서 찾기’라는 의미에서부터 ‘필요한 정보로의 접근채널’이라는 확장되어진지 아주 오래이기 때문이다. 구글은 포괄적으로 가장 훌륭한 검색 결과를 제공해주는 서비스이지만, 검색이라는 것 자체의 성장 때문에 분명히 검색이라는 분야 안에서도 틈새는 수없이 많이 존재하게 마련이고, 따라서 검색엔진들은 구글, 야후, MSN, 네이버에 직접적으로 대항하기보다는 이러한 틈새를 노려 그 분야에서 최고의 검색엔진으로 자리를 굳히는 것이 더 적절한 전략이 아닐까 한다. 지난번 글에서도 공유했었던 것처럼, 참으로 “Small is the new big” 이라는 원칙이 피부로 느껴지고 있는 세상이다. 과연 이러한 틈새들은 어디어디에 있을까가 자연히 다음 질문으로 이어지겠고 수없이 많은 이런 틈새 중에서 눈에 띄는 몇가지의 틈새들에 대하여 “보이지 않는 검색 엔진들"의 예제들을 통하여 나누어보려고 한다.

자, 여기까지는 구글 블로그 검색 잠시 엿보기였었다. 나의 두눈 만을 통해서 보았기 때문에 지식은 국한되고 관찰도 부족하다. 여러눈으로 보았을 때 더 큰 그림이 나오는 것은 당연. 이글을 읽는 여러분의 눈을 통하여 보아주시고 각자의 생각을 남겨봅시다.

참고: Anil DashGoogle Blog Search 에 대한 멋진 분석글.

8/26/2005

The “G"iant has finally made a move!

Filed under: — twdanny @ 1:07 am

and the Giant is called “Google".

모두가 Google Talk에 미쳐서 너도 나도 블로그에 글을 쓰는 와중에(와중1, 와중2), 이 구글이라는 거인은 거의 동시에 다른 surprise들을 통해서 우리를 복종하게 만들고 있다.

1) Google Desktop 2.0
많은 기능이 추가되었다.
- Sidebar: 메일, 증권, 날씨, RSS피드를 한 곳에서 보게 해주는 프로그램. 브라우저에 종속되지도 않는다. 윈도우의 “시작"에 대항하기 위한 작전일까?
- QuickFind: 파일이나 애플리케이션을 원하는 검색어의 일부만으로도 검색 가능하게 해준다.
- 인덱싱 대상 확장: MSN 대화 검색, 이메일외의 아웃룩 자료 등도 이제 검색 대상이다.
- Sidebar APIs: 프로그래머들이 Sidebar에 추가하기 위해서 사용할 수 있는 API. 다시 한번 플랫폼의 파워를 보여준다. 분명, 많은 사람들이 이 API 들을 이용한 각종 애플리케이션으로 작성하면서 멋진 기능들을 내놓을 것이고, 여기에 따라 Google Desktop의 사용률 역시 높아질 것이다.

2) Gmail public 오픈
물론 대부분의 사람들이 초대장이 50장씩 남아있겠지만, 지메일은 이제 그냥 가서 등록만 하면 계정을 얻을 수 있다. 등록절차는 핸드폰 번호를 넣으면 그 핸드폰으로 초대코드가 날아오고 이것을 쳐서 넣는 일종의 인증 방식.

3) 짜잔! Google Talk
구글IM 의 가장 멋진 점을 심플하고 깔끔하다는 데 두고 있는 사람도 있다. 하지만, Google Desktop Sidebar API처럼 Google IM의 최대장점은 그것이 플랫폼으로 탄생했다는 것에 있다.
- 이미 GoogleIM을 통해서 단순히 마이크를 통한 목소리 주고 받기가 아니라, mp3를 broadcasting 할 수 있는 hack이 나와있다. 이 글의 제목에서도 볼 수 있듯이 앞으로 이런 hack은 수없이 많이 나올 것이며, 한번한번 나올 때마다 블로거들에게 소개될 것이고, 구글은 땡전 한푼 안들이고 viral marketing 효과를 얻을 수 있다.
- XMPP/Jabber기반으로 만들어진 Google Talk은 이 프로토콜/표준을 따른 어떠한 애플리케이션과도 커뮤니케이션을 가질 수 있다. “openness"의 가능성을 다시 한번 점쳐볼 수 있는 좋은 기회. 벌써 이런 플랫폼을 시맨틱웹의 RDF를 통한 메타데이터 생성 가능성을 검토해보는 이도 있다. (물론 그의 배경에 알맞게, 이러한 메터데이터의 첫 예제로 사용자 정보 부분에 FOAF을 적용해보기를 원한다.)

이렇게 세 가지가 거의 동시에 나왔다. 거인이 드디어 움직였다!!
그렇다면, 이제 거인이 어디로 갈 것인가?

이 답을 알고 있는 것이 거인 스스로 밖에 없다는 것 역시 우리들을 모두 “구글매니아“로 만들기에 충분하지 않은가? ^^

(마지막으로, 태우의 google talk 주소는: twdanny 골뱅이 지메일 쩜 컴)

8/7/2005

네이트 통에게 드리는 건의사항

Filed under: — twdanny @ 2:15 am

TalkDigger를 통해서 허영검색을 조금 해봤다. 의외로 생각지 못했던 곳에서 많이 찾게된 태우’s log로의 링크와 심심찮게 보이는 펌.

오랜만에 올블로그에 웹2.0 주제로 올라온 글들을 보러 갔었다. 역시, 의외로 생각지 못했던 곳에서 많이 찾게된 태우’s log로의 링크와 심심찮게 보이는 펌 ㅡ.ㅡ;

개인적으로 글 가져가는 것에 대해서 특별히 예민한 편은 아니다. 어차피 정보 공유이자 웹2.0 아이디어의 확산이라고 생각하고 좋은 것이라고 믿으려고 하기 때문에. 물론 CC 라이센스조차 하나도 달아놓지 않은 글들이라 모라고 특별히 할 말은 없지만.

그런데 이렇게 링크를 걸어놓은 글, 특히 “스크랩” 해 간 글을 보다보니 공통점이 하나씩 보이기 시작했다. 모두 네이트의 통을 사용하고 있다는 점이였다. 처음에는 여기에 웹2.0에 관심이 있는 커뮤니티가 있는가 생각했었다. 그러다 더 자세히 보니 알게 된 사실: 모두 “통클리퍼“를 사용해서 내 글들을 담아갔다는 것.

호기심에 통클리퍼를 자세히 보기 시작했다. 여러 종류의 글을 읽어서 여러모양으로 scraping/펌/담기가 가능하도록 하는 사용자에게 있어서는 매우 편리한 기능이였다. 어찌 본다면 조금은 한국판 del.icio.us 와 같다고 할 수도 있겠다.

나같이 이런 거에 민감하지 않은 블로거야 상관이 없지만, 만약에 이런 것에 민감하면서 동시에 자신의 글이 이렇게 쉽게 담아지고 있는 사실을 모르고 있는 블로거들이 이걸 발견한다면 지난 다음 RSS넷과 같은 상황이 벌어지지 않을 것이라고 장담할 수 있을까? 물론 특정 사이트들의 주소를 기준으로,

“저작권 법에 의해 보호받는 내용을 담고 있는 언론사의 사이트에서는 주소담기만 허용됩니다. 내용담기나 캡쳐를 시도하면 양해의 문구와 함께 주소담기 창으로 자동 전환 됩니다….통 서비스에서 미쳐 등록하지 못한 언론사에서 사이트의 클리핑 제한 등록을 원할땐 저작권 보호 센터에 문의해 주시면 반영하도록 하겠습니다.”

라는 내용으로 언론사들의 공격은 피할 수 있겠지만, 나머지 수백만명의 블로거들은 그냥 보호받지 못하게 되는 것이 사실이다.

여기에 따른 태우의 첫번째 제안: 클리핑 시에 원문으로 자동 트랙백을 쏴 주시기 바랍니다.
글 클리핑 하는 것 자체를 막지는 않더라도, 최소한 클리핑해갈 때 트랙백을 남기는 것이 최소한의 예의는 아닐까 하는 생각이 든다. 내 글을 가져갔다 이 자체가 기분이 나쁜 것보다는 내 글을 가져간 사람의 블로그는 어떤 블로그이고 이 사람은 어떤 사람일까가 궁금해 지는 것이 블로거의 가장 기본적인 심리가 아닐까 하는데. 물론 이 트랙백 기능을 완벽하기 구현하기는 어려울 것이다. 각 글마다 트랙백을 할 수 있는 URL을 알아야 하기 때문에. 하지만, 100% 까지는 아니더라도 그나마 열손가락안에 꼽을 수 있는 블로깅 툴/사이트 (태터, 워드프레스, MT, 네이버를 비롯한 각 포탈의 블로그 등등) 에서 각 포스트에 대한 트랙백URL 찾기는 그리 어려울 것 같지 않은데. 사실 블로깅 서비스/툴 같은 경우는 그 분포가 아직 롱테일보다는 파레토에 더 가까운 것 같기에, 이 정도만 신경쓰더라도 많은 효과가 있을 듯하다. 어차피 TalkDigger가 소개된 이후이기 때문에 통으로 클리핑 되는 수많은 글들이 다 파헤쳐지게 되어있기도 하다. 싸이에서 내가 오늘 누가 방문했었을까 보다도 더 궁금한 것은 누가 내 글을 스크랩해 갔을까라는 건 나만 그런 건 아닐 듯 싶은데.

두번째 제안: 태그 기능 추가를 부탁드립니다.
어차피 통은 목표 자체가 내가 원하는 것을 모으는 것이기 때문에 이 부분을 del.icio.us나 flickr와 같이 공유하게 만들고 태그 추가까지 할 수 있는 기능을 추가할 수 있다면 한국 전체를 대표하는 KM(지식경영) 시스템으로까지도 거듭날 수 있지 않을까 하는 생각이 든다. 만약에 한국 사용자가 과연 일일히 글마다 태그를 붙힐 만큼 적극적인가가 의심이 된다면, 최소한 “주제별통"에서 그 주제명을 자동으로 태그로 붙이면 되지 않을까. 각 주제 옆에 그 분류를 입력하여 통 홈페이지에서 디렉토리 식으로 볼 수 있는 기능이 있기는 하나, 이는 어떤 컨텐츠를 미리 정해진 분야로 분류해야 하는 극히 제한적인 정보공간을 창출한다. 이것이야 말로 셔키 아저씨가 말하던 Ontology의 한계점을 드러내게 하는 대표적인 예이다. Technorati가 일반검색과 태그검색을 모두 제공하는 것처럼, 통 역시 이러한 것을 최대한 잘 살리면 좋은 결과가 있을꺼라 하는 생각이 든다. 물론 각 태그/주제에 대한 RSS를 제공해 준다면 금상첨화! 메타데이터가 늘어나는 것은 사용자가 정보를 더 효율적으로 사용할 수 있는 부가가치가 매우 높은 착한 일이다.

마지막제안: 글보기에 달력형을 추가해주시기 바랍니다.
이건 pimon에 전에 사용하려고 했던 아이디어인데 공짜를 드립니다~
지금 현재 통의 글을 볼 수 있는 방법은 “게시판형", “블로그형", “앨범형” 이렇게 세가지이다. 어느 게시판이든 오래전부터 항상 궁금했던 것은 달력형보기는 왜 없을까 하는 점이다. 월별 달력을 보여주고 각 날짜에 등록된 글의 제목들을 달력 안에 보여주는 것. 글의 수가 너무 많으면 상위5개를 보여주고 “(more)"를 추가할 수도 있다. 이러한 보기형태는 사실 개인이 쓰는 글에서 달력형태로 보는 것은 별로 의미가 없을지도 모르지만, 어떤 태그밑에 모인 전체글을 놓고 볼 때에는 전혀 다른 얘기가 된다. 어떤 날짜밑에 모이는 글의 수가 한눈에 보이면서 그 태그나 주제에 관한 통 사용자들의 관심도를 바로 반영하기 때문이다. 특히 언제나 뜨고 지는 것이 많은 한국과 같은 경우에는 사람들(특히 블로거들)의 관심사를 추적해 볼 수 있는 매우 유용한 도구로 사용될 수 있다고 믿는다.

위의 제안들이 특별히 통에게 기대하는 부분은 아니지만, “시장은 대화“라는 점을 기억해 볼 때, 생각해 볼만한 점인 것 같기도 하다. 역시 생각보다 훨씬 길어진 오늘의 글, “태우의 글 퍼가기 승인 약관"으로 마치려고 한다.

태우의 글 퍼가기 승인 약관

태우’s log에 있는 글을 클리핑/scraping/펌/담아가기 해 가시려면 다음 항목을 기록하여 저에게 메일로 보내주시기를 바랍니다. 아래 내용중 하나라도 정확하지 않은 내용이 있을 경우에는 당신의 뼈와 살이 분리될 것입니다.
ⓐ 이름
ⓑ e-mail
ⓒ 빅장 구사 여부
ⓓ 빅장 구사 여부
ⓔ 빅장 구사 여부
ⓕ 빅장 구사 여부
ⓖ 빅장 구사 여부

*^^*

7/23/2005

[시맨틱웹] 3. 꼭 RDF를 사용해야 하나요? XML 으로도 충분해 보이는데.

Filed under: — twdanny @ 10:25 pm

Q:
XML의 상용화는 IT업계 전반적으로 혁명을 가져왔다고 해도 과언이 아닙니다. 엄청난 양의 정보가 XML의 형태로 생성되어 지고 있으며 이러한 추세는 앞으로 더욱 증가할 것으로만 보이는데요. 시맨틱웹의 목표가 웹상의 정보를 정형화하는 것이라면, 이미 자료를 정형화시켜줄 수 있는 틀을 제공하는 XML과 XML스키마를 쓰는 것이 굳이 RDF라는 새로운 데이터모델을 만드는 것보다 훨씬 나은 방법이 아닌가요?

A:
위의 질문은 RDF의 탄생활동 초기부터 나온 의견입니다. 특히 XML의 상용화가 폭발적으로 일어나고 있는 요즘 더욱더 내공이 쌓인 의견이라고 할 수 있죠 ^^ 이 이슈를 좀더 자세히 분석하기 위하여 먼저, XML이라는 데이터 모델과 RDF라는 데이터 모델의 근본적인 특성과 차이점을 알아봐야 하겠습니다.

XML
1. 표현대상: 문법 (syntax)
2. 구조: 트리 구조 (hierarchy, 수직구조)
3. 독립적 데이터 표현 형태로서 간결한 문법구조를 가지고 있음
4. 외부 데이터로서의 연결성이 확장성 결여

RDF
1. 표현대상: 의미 (semantics)
2. 구조: 정점(node)와 변(edge)로 구성된 그래프 구조 (graph mode, 수평구조)
3. URI로 대표되는 웹상의 리소스 사이의 관계를 중심적으로 표현
4. 그래프 모델의 특성상 수직구조로 변환은 쉽지 않으나 연결고리를 중심으로 넓게 분포된 관계중심 데이터를 통합 가능

이 두 모델을 위와 같이 비교해 보면 결국 결론은, XML과 RDF는 두 개의 독립 모델이며 따라서 누가 더 훌륭한 모델인가는 “그때그때 달라요"라는 것을 알 수 있습니다. XML은 그 문법에 간결함과 튼튼한 트리구조 때문에 어떠한 독립 정보 객체를 표현하는데는 적격이라고 할 수 있겠죠. 반면 RDF는 그 모델이 가장 중요한 부분이 바로 Property (그래프에서는 화살표에 해당하는 edge부분)로 대표되는 연결성이라고 할 수 있습니다. 이러한 연결성을 따라가다보면 결국에는 수평적이고 분산적인 정보의 세계로 무한확장이 될 수 있는 것을 알 수 있습니다. 정보를 일단은 정형화된 형태로 표현하는 것이 매우 중요한 요즘 아직 연결고리를 중요시하는 RDF 보다는 XML로 많이 표현되는 것이 자연스러운 것이라고 할 수 있겠습니다.

여기서 잠시 짚어봐야할 것이 있는데요 이는 바로 웹의 기본 성질인 “연결성”입니다. 현재의 웹도 그 중심에는 “연결성"이라는 정신이 존재하고 있습니다. 바로 우리가 마우스로 클릭하여 옮겨가는 또 다른 HTML 문서를 뜻하는 것이죠. 이는 시맨틱웹에서도 마찬가지입니다. 정보는 컴퓨터가 이해할 수 있는 형태로 표현하되 그 “연결성"의 본질은 잃지말자는 것이죠. 이러한 연결성에 바탕한 구조는 위에서 언급한 것과 같이 무한확장이라는 장점을 가지고 있습니다. 이를 통해 어마어마한 양의 다른 종류의 정보를 수집, 통합이 가능해질 뿐 아니라, 이렇게 모아진 정보는 마치 RDB 하나에 모든 것을 모아놓은 것처럼 원하는 대로 쿼리를 통해 검색을 할 수도 있는 장점을 낳죠. 이런 점을 최대한 살리기 위하여 시맨틱웹은 RDF를 그 뼈대로 삼은 것입니다.뿐만 아니라, RDF로 표현된 데이터는 OWL로 확장이 되어 궁극적으로 논리법칙을 적용하는데에도 사용될 수 있다는 장점을 보너스로 부여받게 되지요.

XML vs. RDF 이슈에 들어오게 되면 항상 올라오는 RDF 반대파의 무기가 있는데요 이는 바로 RDF/XML 문법이 너무나 알아보기 힘들게 복잡하고 지저분하다는 것입니다. RDF형태로작성되는 RSS 1.0와 단순 XML 스키마 형태로 작성되는 RSS 2.0 의 차이만 보더라도 알 수 있는 부분인데요. 이는 수평모델인 RDF그래프를 수직구조인 XML 트리로 끼워 맞추면서 맞지 않는 부분이 많이 있기 때문에 나타나는 현상이라고 볼 수 있습니다. 그러나 여기서 XML파(?)는 중요한 것을 잊고 있는데요, 이는 바로 XML이 RDF의 유일한 표현방신이 아니라는 것입니다. 이미 serialization 이라고 불리는 RDF의 표현방식은 여러 개가 존재하고 있으며 그중 일부 형식들은 매우 간결하면서도 동시에 RDF의 본래 장점을 충분히 살려주는 문법을 가지고 있습니다.다시 한번 강조하는 것은, RDF에게 있어서 가장 중요한 것은 그 표현 방식이 아닌 연결성과 관계성을 중심으로 한 그래프 모델이라고 할 수 있습니다.

그렇다고 XML이 시맨틱웹 세계에서 설 곳이 없는 것은 절대로 아닙니다. XML는 본래의 목적인 문서 표현을 위해서 가장 효율적이고 알맞는 형식입니다. 따라서 앞으로 시간이 가면서 정보의 표현 추세는 이러한 독립적 문서들은 XML로 표현이 되며 이를 연결해주는 전체적인 시맨틱웹의 데이터모델은 RDF를 중심으로 구성이 될 듯 싶습니다.

7/16/2005

안전한 RSS

Filed under: — twdanny @ 1:24 pm

RSS는 웹에서 스타크래프트의 초고속 드랍쉽(Dropship) 같은 역할을 해왔다. 정보를 담고 잽싸게 옮기기. 덕분에 누구든지 자신이 원하는 정보를 널리 퍼뜨릴 수 있게 되었다. 그러나, 그 속도와 파급효과가 너무 커서 지난 1월에 있었던 다음 RSS넷 파장과 같은 사건도 있었으며 내가 원하지도 않는 사람이 맘대로 피드를 가져다 사용하는 경우도 많이 나오고 있다. 우리 애기 사진, 우리 강아지 이야기, 여친이랑 깨진 얘기, 부모님 아프신 이야기등 극히 개인적인 얘기는 사실, 내 주위의 몇 명을 빼고 보면은 안되는 “정보"이기도 하다.

이쯤되면, RSS 정보를 생성해내는 주인 입장에서는, “이거 내 껀데, 그냥 내가 원하는 사람만 볼 수 있게 할 수 있는 방법은 없는가?"고 고민을 하게 된다. Atom에서도 이런 것에 관하여 RSS을 암호화하는 스펙이 나오고 있지만, 내가 보기에는 그때까지는 이게 더 괜찮은 대안인 것 같다.

7/10/2005

한국 RSS 리더 시장 분석

Filed under: — twdanny @ 10:57 pm

벌써 몇일이 지나가고 있지만 늦게라도 지키는 약속: 한국내 RSS 리더 시장 분석 보고. 제목은 거창하지만 사실 통계와 시장점유율 등은 feedburner 서비스를 바탕으로 내 블로그 피드를 구독하는 사람들 위주로 계산되었다. Feedburner는 자신의 피드를 이곳으로 point 해 놓으면, 하루동안 구독된 수만 구해주는 것이 아니라, 어떤 종류의 RSS 리더가 접속하였는지, 몇번 접속하였는지 등의 수치를 주며, 본문 내용 안에 mp3 파일이 있으면 자동으로 enclosure에 삽입시켜주는 등 각 피드에 대한 매우 유용한 서비스를 제공하는 곳이다.

0. 시작하기 전에

내 블로그의 본래의 피드는 http://twlog.net/wp/wp-rss2.php였는데 이를 feedburner로 변환시킨 후 사용한 것은 2월초부터이다 (http://feeds.feedburner.com/twlog). 그 전부터 이미 1번 피드를 사용한 곳이 있었기 때문에 피드구독이 갈라지는 현상이 나타나기 시작하여, 지금은 feedburner 피드가 훨씬 많이 있음에도 아직도 1번 피드가 사용되는 곳이 있다. 따라서 오늘의 통계 산출은 전체적으로는 feedburner 피드를 기초로 잡았지만, 다음 RSS넷과 같이 1번피드의 구독자수가 증가하고 있는 특별한 경우에는 feedburner 통계를 1번 피드로 통계로 대체하여 사용했다. 오늘의 통계는 전통적이고 체계적인 통계분석기법에 기초한 것이 아니라, 내가 아는 대로 이 방법, 저 방법을 적용해본 경우이니 이 점을 반드시 명심하기!

1. 태우’s log의 방문자와 구독자수 증가 추이

monthly_visitors
monthly_subscribers
weekly_subscribers
[Figure 1] 태우’s log의 방문자 및 구독자 수 증가 추이

지난 4월에 처음으로 방문자 구독자수 증가 추이를 분석하고 난 후 많은 변화가 있었다. 구독자수는 끊임없이 증가하고 있으나, 선형 그래프에서 볼 수 있듯이 증가율 자체는 크게 변함이 없다. (대략 월별 구독자수 18명 증가). 단지, 마지막 3주를 보면 구독자수의 증가율이 조금 높아지는 것을 볼 수 있는데, 근래에 들어 갑자기 여기저기서 태우’s log를 알아보고 연락을 주는 사람도 있으며 각종 RSS리더에서 구독자의 수가 갑자기 많이 증가하고 있는 것을 봐서는 아마도 드디어 고정 증가율을 벗어나 일종의 지수법칙으로 증가형태가 변하지 않을까 내심 기대하게 된다.

자세히 보면, 그래프를 보면 갑자기 구독자수가 확 늘어난 적이 몇번 있는데 (3월초, 4월말/5월초, 6월말~) 대부분의 경우는 올블로그, likejazz, 이장님 블로그, 그리고 readwriteweb에 소개된 적과 같은 이미 많은 방문자/구독자를 확보하고 있는 블로그에 노출되었을 때 나타난 현상으로 long tail 세상에서도 아직도 상위 노드의 힘이 아직도 얼마나 중요한가를 보여준다. 또한, 위에서 보여주지 않지만, 일일 그래프를 보면 주말마다 구독자의 수가 많게는 15 ~ 20명까지도 뚝 떨어지는 현상을 보여주는데, 이는 많은 구독자들이 회사에서 데스크탑 리더로 내 블로그를 구독하거나 아니면 주말에는 아예 블로그 자체를 읽지 않는 것으로 해석이 된다.

2. RSS 리더 시장 점유율 분석

Feedburner는 각 reader의 구독자수를 보여주기 때문에 현재 내 블로그 구독자의 RSS리더 분포율을 알 수 있다. 사실 Feedburner에 나온 총 구독자수가 100명이 넘어서 그것을 기념으로 이번에 RSS글을 쓰는 것인데, 두가지 데이터를 왜곡해야할 부분이 생겨서 여기서 미리 알린다: 1) 다음 RSS넷에서는 위에서 말한 것 처럼, Feedburner 피드가 아닌 1번 피드의 구독자들이 훨씬 많으며 꾸준히 증가하고 있다. 따라서 아래에는 표시되지 않았기 때문에 RSS넷에 구독자수로 나온 1번 피드의 ‘14′를 구독자로 정의하여 추가하였으며, 2) Feedburner customer support 에도 물어봤던 사항인데, Rojo는 특정 피드의 구독자수를 Feedburner에게 알려주지 않는다고 한다. 그래서 구독자수가 ‘1′로 나오는데, 이를 Rojo에서 보이는 ‘24′로 대체해서 사용한다. 이 두 점을 고려하여 데이터를 산출하면 다음과 같은 결과가 나온다.

rss reader 2
rss reader graph
[Figure 2] RSS 리더별 시장 점유율 보기

아마도 가장 놀라운 사실은 근 40%에 달하는 Bloglines의 구독자수와 50%가 월등히 넘는 Bloglines + Rojo의 구독자 수이다. 내 블로그가 오로지 한국인들만 보고 이해할 수 있는 블로그임을 고려해볼 때, 이는 한국 시장내 RSS리더의 시장 점유율을 대략 가늠케 해주는 중요한 자료가 될 수 있다. 한국에서 사실상 유일하게 널리 알려진 RSS리더라고 할 수 있는 다음 RSS넷의 시장점유율은 10%를 간신히 넘기고 있다. 그 다음으로 놀라운 사실은 SharpReader를 사용하는 한국 구독자가 많다는 사실이다. 아마 전에는 그리 널리 알려지지 않았었던 사실일지도 모르겠다. 한가지 또 재미있는 것은 Sage + Live Bookmarks + Thunderbird의 모질라군을 합쳐보면 총 16구독자로 다음 RSS넷을 앞지르고 3위에 등극한다는 사실.

한가지 개인적으로 조금 이해가 되지 않는 것은 한국 시장 점유율 80% 이상으로 알려져 있는 연모가 내 블로그 피드상에는 나타나있지 않다는 점이다. 최대로 많이 구독하고 있을 가능성은 “not identified"의 6명. 그러나, 이 숫자 역시 다른 “not identified” RSS 리더와 섞여 있을 가능성이 높아서 사실 가장 현실에 가까운 연모 구독자수는 2~3명 정도일 것이다. 조선일보에서 RSS 리더로 소개되고 있는 리더여서 80%에 달한다고 발표된 것일까? 하여튼, 이 것은 앞으로도 쭉 지켜봐야 할 부분.

아직 도입기도 미치지 못했다고 볼 수 있는 한국 RSS 리더 시장은 아직은 Bloglines/Rojo/SharpReader와 같은 외국제품에 의해 점령당했다고 할 수 있다. 그러나 그만큼 앞으로 성장가능성이 높으며 지금 뛰어 들어도 조금도 늦지 않은 시장이라고 예상한다.

3. Bloglines vs. RSS넷

이쯤되면 구독수도 그리 많지 않은 태우의 피드만으로 이런 결정을 내리기에는 너무도 섣부르지 않은가 하는 의문이 들 것이다. 특히 RSS넷 입장에서는 Bloglines에 전혀 미치지 못하는 수치를 보면 조금 자존심이 상할 수도 있는 일이다. 뿐만 아니라, 내가 워낙 Bloglines와 Rojo 칭찬을 많이 하고 다닌 공돌이이기 때문에 데이터에서 Bloglines/Rojo로 통계의 치우침이 있는 것이 당연해 보일 수도 있어 다른 리더들이 상대적으로 under-represented되었을 가능성이 높다고 볼 수도 있을 것이다.

그래서 이번에는 내 피드 뿐만이 아니라, 다른 블로거들의 피드를 기준으로 Bloglines vs. RSS넷을 한번 분석해 보았다. 아무래도 구독자 수가 많을 수록 좋을 것 같아 뽑은 대상은 작년 NG Forum 2004에서 상위30위에 선정된 블로그 중 15위까지를 대상으로 했다.

bloglines_vss_rssnet

bloglines_vss_rssnet_graph
[Figure 3] Bloglines과 다음 RSS넷의 상위 15개 블로그의 피드 구독자수 비교 (그림크게보기)

위의 그래프에서 보면 알 수 있듯이, 특정 한두명의 블로거를 제외하고는 대부분의 경우에서 Bloglines이 훨씬 앞서 나간다. 평균을 보면 다음 RSS넷이 Bloglines의 삼분의 이 밖에 못미치는 것을 볼 수 있다. 다시 한번의 Bloglines의 위력을 보여주는 스냅샷.

4. 해외 통계와 비교

이 글을 준비하면서 마침 Feedburner가 스스로 발간한 총 리더 시장 점유율 결과를 접하게 되었다. 당연히 그들의 결과를 봤는데 결과는 놀랍게도 My Yahoo가 60%라는 압도적인 점유율로 2위인 Bloglines (10%)을 멀찌감치 따돌리고 있었다. 이는 항상 RSS 리더 하면 누구나 제일 먼저 떠올리는 Bloglines에게는 충격적인 소식이 아닐 수 없다. My Yahoo는 특징이 RSS라는 단어를 아예 사용하지 않으면서 사용자에게 기술적인 부분을 최소화 시켜서 단순히 ‘채널구독’이라는 개념으로 전파했기 때문에 아무래도 진입장벽이 낮았었지 않았을까 한다. 물론, 수천만의 회원을 소유하고 있는 야후에게는 이런 점유율 가지기가 그리 어렵지 않았을지도 모르는 일이다.

그러나, 이 통계는 사실 ‘왜곡’된 통계이다. My Yahoo의 홈페이지에서 보여주는 ‘Most Popular’피드 중 상위 10개를 빼면 My Yahoo는 RSS 리더 시장에서 사라지고 만다. 즉, My Yahoo는 어마어마한 수의 사용자가 특정 피드만 몇 개 정도 읽는 모습을 보여주고 있기 (아마도 유명 뉴스 사이트가 아닐까 한다.) 이들을 제외하면 수많은 블로거들의 롱테일을 포함하는 세상에서는 바로 RSS 리더 시장이 다음과 같이 재편성된다.

Bloglines – 19.49%;
NetNewsWire – 10.07%;
iTunes – 9.53%;
Firefox Live Bookmarks – 7.25%;
iPodder – 7.17%;
My Yahoo – 6.68%;
FeedDemon – 4.23%;

상대적으로 고른 분포이다. 이는 아직 해외시장에서도 clear-cut 승자는 없다는 것을 뜻한다.

이와 같은 현상은 사실 다음 RSS넷에서도 나타난다. 전에 오마이뉴스의 구독자에 관한 글에서도 소개했었지만, RSS넷은 홈페이지에 스스로 “추천"하는 채널을 보여줌으로써 많은 사용자들이 자동으로 이들을 구독하도록 유도하는 구조를 가지고 있다. 결과? 오마이뉴스 - 12,500명, 중앙일보 - 10,000명, 조선일보 - 1,300명이라는 Bloglines에서도 쉽게 보기 힘든 천문학적인 숫자의 구독자수가 나타난다. Bloglines에서는 이 채널들의 구독수가 2~300 정도이다. 참된 LongTail을 시험해 볼 수 있는 좋은 기회이므로 다음 RSS넷 관계자들은 이를 잘 살려보시야요. ^^

5. Implications

위의 수치들은 무엇을 뜻하는가?

1) RSS 리더 시장에 뛰어들라. 아직 한국 RSS리더 시장은 매우 미성숙하다. 다음 RSS넷은 속도/성능면에서 매우 저조할 뿐 아니라 full-text 피드조차도 텍스트의 일부만을 보여주며, 무엇보다도 가장 기본이 되는 검색기능이 내재되어 있지 않다. 연모는 개인적으로 써본적이 없어서 어떤지는 모르지만, 나름대로 훌륭한 프로그램이라고 생각이 드나, 한 PC에 종속된다는 데스크탑 리더의 치명적 약점을 벗어나지 못한다. RSS는 앞으로 현재의 이메일과 같이 어마어마한 트래픽과 정보과 왔다갔다할 새로운 채널이다. (물론 다른 버전과 Atom도 있지만) 따라서, 충분히 고려해볼 만한 사항!

2) Podcasting을 사랑하라. 위의 도표에서도 볼 수 있었겠지만, 나온지 이제 겨우 3주가 되어가는 iTunes가 RSS 리더 시장의 10%를 덜컥 잡아먹고 3위로 뛰어올랐다. 오로지 Podcasting 피드만으로 말이다. Feedburner의 홈페이지를 봐도 총 74,000여건의 피드중 10,000여건 (13.5%) 정도가 파드캐스팅 피드라고 한다. 이 역시 놓치지 말 것!

3) 긴 꼬리를 꼭 쥐어 잡아라. My Yahoo와 RSS넷의 경우에서 봤지만, 아직은 주 인기채널의 대부분이 메인스트림 피드이긴 하지만, 블로거들의 우후죽순으로 태어나고 피드의 형태도 다양해지는 세상에서 롱테일을 다 소화해낼 수 있는 플랫폼을 구축하는 것은 필수적이다. 이를 위해서는 피드만 많이 가지고 있으면 끝나는 것이 아니라, 숨어있는 우수 블로거들을 캐내고 원하는 피드를 찾아낼 수 있도록 Collaborative Filtering 이나 양질의 검색엔진을 추가해주는 것 역시 빠질 수 없다.

6. 마치면서

태우’s log의 피드 구독자의 수치를 가지고 시작한 한국 RSS 리더 시장의 분석을 여기서 마치려고 한다. 다시 말하지만, 이 분석은 불완전한 데이터와 나의 사이비 분석 방법에 기초를 두었기 때문에 그대로 믿으면 안 된다. 단지, 여기에 올라온 분석을 토대로 머리속에 나름대로의 그림을 그리는데 사용하기를 바란다.

마지막으로 이 글을 여기까지 모두 읽은 분들에게 참여해볼 수 있는 멋진 기회를 선사하려고 한다.

여러분들은 어떤 리더를 사용하고 계시나요? 현재 사용하고 계신 리더가 맘에 드시나요? 앞으로 나올 RSS리더에는 어떤 점을 기대하시나요? 생각을 나눠주세요.
- 태우 질문

** 태우는 사실 RSS Reader라는 말을 별로 좋아하지 않는다. 사실 내가 더 좋아하는 용어는 RSS Aggregator이다. 리더란 단어는 아직도 웹이 단순히 글을 ‘읽는’ 사람들만을 위한 존재임을 암시하므로 더 이상 기계가 처리하는 플랫폼이라는 개념을 알려주지 않는다. 하지만 이 글에서 ‘리더’를 고수한 이유는 ‘애그리게이터’란 단어는 너무 길어서 귀차니즘에 승복했기 때문이다. ㅡ,.ㅡ;

6/3/2005

RSS만 읽어서는 대화가 안 된단 말입니다.

Filed under: — twdanny @ 1:43 am

얼마전에 내가 썼던 글에 대한 스스로의 반박의 글을 써 본다.

음.. 반박까지는 아니고, RSS리더를 통하여 정보의 소비자의 입장에서 훨씬 정보관리/통제능력을 넓힌다는 것에 대하여 열변을 한 후에, 거기에서 무시했던 단점에 대하여 말하려고 한다.

RSS리더로 글을 읽기 시작하면, 대화가 단절되기 쉽다. 왜냐하면, RSS 피드는 코멘트/답글 부분을 제공하지 않기 때문이다. 사실 블로그의 가장 큰 훌륭한 점이 바로 “누구나 하고 싶은 말을 할 수 있다"라면 (이번주에 너무 유명했던 댄 길모어 모드에서 말해봤다 ^^), 이에 못지 않게 좋은 점은 “블로그는 대화를 생성해낸다"는 점이다.

이 대화의 형태는 주로 답글과 트랙백으로 나타난다. 인기 블로거들의 포스트에는 수십개의 답글이 따라오게 마련인데, 일단은 이를 통해 댓글의 quality를 떠나서 많은 대화가 오고가는 것은 사실이다.

RSS만을 구독하면 full-text 피드를 제공한다고 하더라도, 본문만 읽게 된다. 물론 대부분의 블로그에서 comment 피드를 같이 제공하는 것은 사실이지만, 이 코멘트들이 어떤 특정 글에 관한 엮인 글이다라는 부분이 없기 때문에, 사실상 효용가치는 떨어진다. RSS는 이메일과 달라서 사실 아직까지는 one-way 커뮤니케이션 수단(syndication)이기 때문이다. 결국, 내가 받고 싶은 정보만 들어오게 만드는 통로인 것이다.

나를 비롯해서, 이런 것이 많이 아쉬운 사람들이 있다. 대화를 즐기는 사람들. Bloglines에 포스트 밑에 “comments” 라는 링크를 달아 클릭하면 바로 답글 부분으로 가는 서비스가 있기는 하지만, 나같은 경우도 대부분 그냥 지나가기 태반이다.

Russell Beattie는 이런 점에 대해서 피드안에 바로 코멘트를 입력할 수 있는 form 태그를 넣는 것이 어떻겠느냐고 제안한다. 그러면 RSS 리더에서 바로 답글을 다는 것이 가능하기 때문이다. 이메일 답장 바로 쓰듯이.

아주 괜찮은 발상인 것 같다. RSS 리더에서 Russell Beattie에게 답글을 쓴 이들도 대부분 흡족해 하는 듯 하다. 물론 이런 기능은 블로그 작성자가 일일이 하는 것이 아니라 블로깅 툴이 옵션에 따라서 자동으로 해주어야 할 것이고. (곧 워드프레스 플러그인이 나올 것 같은 느낌 ㅋㅋ), 기술적으로 아직은 이게 허용되는 RSS 리더도 있고 안 되는 것도 있다고 하니 좀더 두고봐야 할 것이다. 물론 항상 새로운 기술이 시도될 때 가장 먼저 고려되어야 할 사항은 보안이니, 이쪽도 신경을 써야겠고. (일단 머리속에 드는 생각은, “블로그 코멘트 스팸이 더 늘어날 것 같은데..")

결론적으로는, 이런 방식으로도 대화를 더 많이 할 수 있는 길이 생긴다면 얼마나 좋을까? 내가 읽고 싶은 글을 내가 원하는 방식대로 정리해서 읽고, 그 뿐만 아니라 그 글에 대해 바로 답변함으로써 대화도 참여할 수 있고. 모든 사람이 대화를 주고 받을 수 있는 read/write web 의 모습이 우리 앞에 다가오고 있다.

Cluetrain Manifesto Thesis #1:
“Markets are conversations.”

5/22/2005

지금 RSS에 투자하세요.

Filed under: — twdanny @ 12:38 am

나같은 공돌이들의 가장 큰 문제점은 기술천국에서 벗어나지 못한다는 것이다. 어떤 훌륭한 기술에 대해서 알고 나면, 비지니스 측면이나 사회적, 법적 측면은 쉽게 잊곤 한다. 이런 실수에서 벗어나오기 위해서 내가 자주 택하는 방법은 과연 어떤 기술이 Industry Standards로 자리 잡는가 이다. 훌륭한 기술이던 아니던 어떤 기술이 산업계 전반에서 사용된다는 것은 바로 싫던 좋던 이제 이 기술을 사용해야 한다는 뜻이며, 이런 기술을 싫어서 채택하지 않는 것은 바로 나 스스로가 표준에 기준한 열린 세상에서 멀어지기를 선택한다는 것이다.

RSS는 이제 그런 표준으로 자리 잡아가고 있다. syndicate conference을 비롯하여 이번 주동안에 있었던 수많은 얘기들은 이제 RSS가 더 이상 업계에서 단순히 early adopters들만을 위한 기술이 아니라 이제는 참으로 업계표준으로 자리를 잡고 있다는 것을 보여주고 있다. 정보의 구조화를 외치는 나는 개인적으로 이러한 변화를 매우 긍정적으로 받아들인다. 이제는 모두가 web 1.0 에서 벗어나 슬슬 web 2.0로 이동해서 가야할 때가 왔기 때문이다.

RSS/Atom과 같은 syndication 기술은 오랫동안 있었지만 참으로 하이라이트를 받기 시작했던 것은 2004년이였다. Bloglines, Feedster, Feedburner, Ludicorp (Flickr) 등의 벤처회사들이 선전하는 것을 한발짝 뒤에서 지켜보고 있던 큰 형님들 (구글, 야후, MSN)은 RSS의 기술적 우월성에만 확신을 가진 것이 아니라, 시장성에 대해서도 테스트를 이제 모두 마칠 수 있었다. 2005년에 들어서 모두가 무섭게 RSS를 비롯한 구조화된 정보 서비스에 뛰어들고 있다. Yahoo는 일찌감치 RSS 리더와 360으로 먼저 들어갔으며, 금주에 발표된 구글의 개인화 홈페이지는 곧 Universal RSS Support를 한다고 하며, Ballmer의 RSS에 대한 긍정적이지만은 않은 모습을 보인 인터뷰 때문에 잠시 소란했었던 마이크로소프트 역시 RSS 연구하는 팀들이 여러개가 있으며, MS의 야심작인 start.com 역시 곧 RSS 리더를 선보인다고 한다.

이러한 추세는 무엇을 반영하는가? 현재의 정보시장의 웹은 점점 더 웹의 창시자 팀버너스리가 꿈꿔오던 시맨틱웹에 가까워지고 있다는 사실이다. 다시 한번. 웹은 점점 더 시맨틱웹에 가까워지고 있다. 이유는 매우 간단하다. 정보의 양이 기하급수적으로 늘어나고 있고 이러한 대량의 정보를 처리하기 위해서는 좀더 정리된 구조가 필요하기 때문이다. 한단계 더 나아가, 이렇게 정리된 정보마저도 사람에게는 너무나 많은 양이기 때문에 기계가 처리할 수 있도록 정보를 정리하고 멍청한 기계들을 위해서 조금 더 복잡하더라도 RDF와 같은 구조를 통해서 기계에 의한 처리를 가능토록 하는 것이다. RSS는 이런 면에서 우리가 볼 수 있는 HTML 이후 최초의 웹상에 정리된 정보구조를 우리에게 갖다 주었다. 그러나 더 자세히 살펴보면 RSS는 아직 이런 정보구조화 단계에서 불과 첫걸음에 불과하다.

금주에 또 하나의 멋진 소식은 바로 Pubsub에서 드디어 Structured Blogging을 지원하기로 했다는 사실이다. 이 주제에 관해서는 오랫동안 글을 쓰려고 했는데, 오늘 쓰는 주제와 비슷해서 오늘 글에 포함시킨다. Structured Blogging 이란 쉽게 말하면, 우리가 현재 RSS 필드값중 description이라는 곳에 단순한 포스트 요약 부분이나 HTML으로 작성된 블로그 글을 넣는 것 대신 좀더 구조화/정리된 값을 더 넣어주는 것이다. 즉, RSS를 통해서 우리가 볼 수 있는 부분은 그냥 글이 아닌, 소프트웨어에서 사용할 수 있는 RSS description 필드값내에 또다른 나름대로의 스키마를 구성하는 필드값이 있다는 뜻이다. 단순히 오늘의 영화를 소개하며 “오늘의 영화는 이런 건데, 제목은 이거, 주인공은 누구, 감독은 누구이다. 이걸 봤는데 이런이런 생각이 들더라"가 아니라 값을,

제목: ___
주인공: ____
감독: ___

등으로 정리하여 이에 관련된 소프트웨어가 제목, 주인공 등 각자에 알맞는 필드값을 자동으로 처리해줄 수 있는 것이다.

structuredblogging
[Figure 1] Structured Blogging 에 의해 생성된 자료. Rating 과 제목 등은 이미 구조화된 값으로 들어있다.

이는 바로 RDF가 하는 일이다. 정확히 RDF라는 구조를 사용하지 않았을 뿐, 단순 자연어로 그 본문이 구성되던 RSS내에 또 하나의 구조화된 자료를 넣음으로써 자료가 기계에 더 효율적으로 처리될 수 있도록 한다는 점은 RDF가 지향하는 점과 일치한다. (사실 Structured blogging이 RDF를 지원할 예정이라고는 한다.)

RSS가 우리에게 선사해 준것은 바로 정보의 세상에서 정보가 더 빨리 무한으로 퍼져나갈 수 있도록 새로운 교통체제를 만들어 준 것이다. 그렇다면 이러한 교통도구에 의해서 전달되는 승객인 내용물도 이제는 더 자세히 구조화될 필요가 있는 것이다. 결국, 알게 모르게 시맨틱웹에 우리는 조금씩 다가가고 있는 것이다.

결론적으로 내가 오늘 하고 싶었던 말은, 이제 한국에 있는 사람들도 바로 RSS 사업에 뛰어들어 갈 만한 좋은 시기라는 것이다. RSS로 창출해 낼 수 있는 시장은 어마어마하게 많고 그 종류도 다양하다. 가장 대표적인 예인 RSS 리더만 하더라도, 한국에서 아직 내가 정식적으로 본적 있는 것은 RSS넷, xpyder, 그리고 태터 리더 정도이다. 나의 RSS구독자들만 보더라도 모든 RSS 리더들이 위의 세개를 제외하면 모두 외국 것이다. 종류 뿐만이 아니라 사실 읽는 리더기 개수를 보더라도 외국 제품들이 그 수가 훨씬 앞선다. 다음이 한메일로 승부해서 승리한 것 같이 아직 도입기 정도에 있는 RSS 기술은 커다란 기회를 제공해 줄 것이다.

오늘의 교훈:
“님들. RSS에 투자하세요.”

5/10/2005

RSS 가 할 수 있는 것

Filed under: — twdanny @ 11:11 pm

블로그 세계에 너무 오래있다보면, RSS를 블로그의 일부라고 생각하며 RSS가 할 수 있는 것이 블로그세계 밖에는 없다고 생각하기 쉽상이다. 땡!

사실 RSS는 이미 블로그 세계보다 더 큰 세상을 만들어가고 있다. RSS는 앞으로 2, 3, 4, 5… 년 후 지금 우리에게 이메일과 같은 가장 흔히 사용되는 정보전달도구중의 하나로 사용될 것이다.

못 믿겠다고? 아래 자료 참고하기.

The Business Case for RSS (marketingstudies.net에 의해 출간된 공짜 PDF 레포트.)

5/8/2005

attention.xml 정리

Filed under: — twdanny @ 4:07 am

(글이 길어진 관계로 인쇄해서 보시고 싶은 분들을 위해: 여기를 클릭하세요.)

attention
n.
1 U 주의, 주목; 주의력: He was all ~. 그는 경청하고 있었다
via 다음사전

1. 배경

팀버너스리가 꿈꾸었던 월드와이드웹에 대한 가장 큰 비전은 바로 read/write web이였다 - 모든 이들이 정보를 생성해 내고 이 정보사이에서 대화가 오가고 협업이 이루어 지는 하나의 플랫폼. 웹의 첫 10년 정도를 장식하는 1세대 웹에서는 사실 기존 언론구조를 크게 벗어나지 못하고 웹은 아직 수가 그리 많지만은 않은 컨텐츠 생성자에게 수많은 소비자가 몰리는 단순한 또 하나의 언론의 도구로 사용되었다. 웹은 주로 기업이나 언론단체가 자신의 알리고 싶은 것을 알리게 만드는 매우 효과적인 도구로 사용되었으며, 일반인에게는 이메일과 같은 개인적인 공간에서의 정보교환, 또는 커뮤니티와 같은 닫혀진 환경에서의 정보생성 등의 역할을 주로 해왔다.

블로그 등의 등장으로 웹은 조금씩 성격이 바뀌게 된다. 정보의 생성자의 수가 무한대로 늘어남에 따라 정보의 경로는 소수-to-다수 (few-to-many)에서 다수-to-다수 (many-to-many), 그리고 심지어는 아무나-to-아무나 (any-to-any)로 점차 바뀌어 가게 된다. 하나하나의 정보 생성 소스(source)는 컨텐츠를 퍼뜨리는 것이 효율적으로 진행될 수 있도록 새로운 content syndication format인 RSS를 사용하게 되었고, 이는 정보의 사용자 입장에 있어서 원하는 정보를 자신만의 컨테이너 (RSS reader/aggregator)를 통해서 선택할 수 있는 도구를 제공해 주었다. 결국, 현재의 웹은 무한대의 정보의 생성 환경 안에서 사용자들이 원하는 것을 선택하여 정보를 흡수하는 구조로 진화된 것이다.

여기서 모든 것이 멈추었었다면, 우리가 세상을 얼마나 더 쉽게 살 수 있었으리요. 결코 나쁘지만은 않은 문제가 발생하는데, 이는 정보의 소비자에게 선택의 권한이 주어졌음에도 불구하고 소비자가 선택하는 정보의 생성자들에게 의해 생성되는 정보의 양이 이미 평균 소비자의 정보소비/흡수 능력을 월등히 뛰어 넘었다는 것이다. 하루에도 수백 또는 수천개씩 새로 업데이트되고 생성되는 글(blog post)의 양은 기껏해야 하루 2 ~ 3시간을 투자하면 정말 잘 했다 싶을 우리 평균의 정보 소비자에게는 너무나 벅찰 수 밖에 없는 것이다. 당연히 각각의 정보 소비자는 제한된 시간 내에 정보를 좀더 효율적으로 관리하고 소비해 낼 수 있는 방법을 만들어 내고 있지만, 대부분의 경우 이것 역시 많은 한계를 들어낸다. 예를 들어, 현재 우리가 사용하고 있는 다양한 방법들은 굳이 비유를 해보자면, 달력이나 전화번호부 하나 들어있지 않는 맨 하얀 연습장에 날짜를 일일히 기재하고 거기에 자기 스스로 분류를 만들어서 해야할 일을 적어놓고 나름대로 밑줄이나 볼펜색 다른 것으로 쓰기 등으로 자신만이 간신히 알아볼 수 있는 그리고 다른 날짜에 일어나는 일이나 어떤 사람의 연락처와는 전혀 관련히 없는 닫힌 계획표를 사용하는 것과도 비슷하다. 이것이 PDA상에 있는 아웃룩과 같은 PIMS (Personal Information Management System)을 사용했을 때 얼마나 자신의 일정/할일 등을 효율적으로 관리할 수 있는가에 비교해보면, 무언가 더 나은 시스템의 필요성을 바로 인식할 수 있을 것이다.

지금 현재 RSS리더의 대부분은 그 형태가 OPML을 통한 아웃라인 만들기 (이는 원하는 분류를 만들고 그 하위에 그 분류에 적합한 RSS 피드 추가하기)를 통하여 정보의 선택을 허락하고 각 피드에 대하여 아직 읽지 않는 글은 bold 폰트 등으로 표시하여 내가 무엇을 아직 읽지 않았는가, 그리고 혹시 이미 읽은 것 중에서 관심이 있는 것은 체크하기 등으로 표시하기 등등으로 관리하는 방법까지만 제공하고 있다. 이는 평소에 사용하던 이메일 시스템과 비슷한 것으로, 대부분의 경우 단순히 “나중에 다시 읽기"등으로 표시하는 것으로 멈추게 된다. 아쉽게도 이렇게 나중에 다시 읽을 글들은 쌓여만 가고, 잠시 여행등으로 자리를 비운 사이에는 수백/수천의 또 다시 확인해야 할 글들이 올라와서 정보를 원하는 우리에게도 적지 않은 양의 스트레스를 준다. 모두 다 알겠지만, 정보의 관리는 좀더 효율적으로 되어야 하는 것이다.

2. 효율적인 정보 관리를 위한 노력 - attention.xml 의 등장

그렇다면, 정보를 관리하려면 어떤 기능 또는 조건이 우리에게 필요한 것일까? 몇가지 적어보자면 다음과 같다.
1) 정보의 실시간성 - 대부분의 RSS feed 최근의 글이 가장 중요한 글이다.
2) 정보 생성자의 신뢰도 - RSS feed가 어느 곳/누구에게서 왔는가가 우리에게 중요도를 결정해 준다.
3) 내가 관심있는 분야 - 내가 가장 많이 읽는 블로그, 주제가 결국 나의 관심분야를 반영한다.
4) 내가 관심없는 분야 - 내가 절대 읽지 않는 블로그, 주제는 결국 내가 최소한 그것들을 skim 하면서 확인해 본다고 할 때, RSS 리더에서 나의 귀중한 시간만 낭비하고 있는 것이다.
5) 나와 비슷한 관심분야를 가진 사람들의 관심분야 - 이 사람들의 이야기의 주제와 그들의 생각이 나에게만 국한되어 있는 이해도를 넓혀줄 뿐 아니라 내가 알아야 할 새로운 것을 배울 수 있는 기회를 제공해 준다.

우리에게 이미 포화상태에 이르러 버린 정보의 양을 관리하는데도 마찬가지 원칙을 적용하기 위해서 고안된 것이 바로 attention.xml이다. attention.xml은 블로거 세계의 거장중 하나인 Gillmor GangSteve GillmorTechnorati의 CEO인 Dave Sifry와 함께 위와 같은 문제에 대하여 이야기를 나누다가 생각해낸 것이다. Dave Sifry는 Technorati에서 이 아이디어를 계속 진행시키기로 했고 이에 따라 Tantek CelikKevin Marks와 같은 유명 엔지지어를 고용해 여기저기서 attention.xml의 상용화를 위해 노력하고 있는 중이다.

attention.xml은 위 다섯가지를 고려한 RSS feed를 통한 정보관리를 좀더 수월하게 진행할 수 있도록 우리의 RSS 피드 목록에 여러가지 부수적인 데이터를 추가함으로서 이렇게 정리된 데이터를 통하여 사용자 스스로가 좀더 정보를 깔끔하게 흡수하자는데에 그 의의를 두고 있다. 항상 말하지 않았던가? 메타데이터는 아름답다고 ^^;

3. Technical Specifications

그렇다면 attention.xml은 도대체 어떤 모습을 가지고 있을까? XML에 대한 너무 기술적인 것을 피하도록 좀더 상식적으로 이해할 수 있도록 설명하도록 한다.

그 가장 바닥에는 우리가 흔히 알고 있는 OPML이라는 형식이 있다. OPML는 위에서도 설명했지만 기본적으로 outline 이라는 요소를 계속 하여 트리구조로 만들어 가면서 전체적인 아웃라인을 표현하도록 도와주는 포맷이다. RSS 리더에서는 대부분, 사용자가 만들어놓은 분류, 그리고 각 분류 하에 있는 하위 분류 또는 RSS 피드로 구성이 되어 있다.

opml
[Figure 1] 태우의 다음 RSS넷 OPML의 일부 모습 (그림크게보기)

attention.xml 은 분류(Groups)와 피드(Feeds)에서 한단계 더 나아가 기본 구성요소로 각 글/포스트를 나타내는 아이템(Items)이라는 요소를 추가한다. 이러한 기본 구성 요소를 바탕으로, 일단 각 피드에 대한 구독시작시기/구독해제시기를 기록하여 내가 관심있는 피드가 무엇인지를 기록한다. 또한 각각의 피드와 아이템에 대하여 가장 최근에 읽은 시간은 언제인지, 얼마나 오래 읽었는지, 몇번이나 읽었는지 등에 대한 기록을 남김으로써 내가 자주 읽는 글은 당연히 나의 관심분야를 반영한다라는 점을 충분히 살린다. 뿐만 아니라, 각각의 피드에 대하여 rel/XFN을 사용하여 이와 관련된 다른 사람은 누가 있는가를 표현함으로써 이를 통한 소셜네트워크로 연결될 수 있는 출구를 만들어 줄 뿐만 아니라, 어떠한 글이나 주제에 대하여 찬성/반대/중립을 표현해 주는 rel/VoteLink 값을 남김으로써 정보의 사용자에게 스스로 참여함으로써 이를 제공하는 시스템에게 Collaborative Filtering 기능을 추가해줄 수 있는 기회를 주고, tag를 연결함으로써 자동으로 folksonomy 가 구성될 수 있도록 도와준다.

attention.xml 포맷은 XHTML에 기초하였으며, XOXO와 같은 Outline 표현 포맷, XFN과 같은 소셜네트워크 포맷을 이용하여 새로운 것을 만들어내는 것이 아닌 이미 만들어진 것을 재활용하는 그들의 철학을 반영한다.

4. attention.xml을 통해 얻을 수 있는 것과 없을 수 없는 것

attention.xml은 우리가 일반적으로 매일 접하게 되는 수많은 feed와 포스트를 효과적으로 정리하고 우리가 정말 “필요한” 정보만 먼저 흡수하게 되도록 그리하여 제한된 시간 내에 중요도가 낮은 것들은 자동으로 무시될 수 있도록 도와준다. 우선 대부분의 경우 가장 최신의 글로 정리를 할 것이고, 그 후에는 가장 자주 읽는 피드, 가장 많은 시간을 보내는 피드 등을 기준으로 내가 평소에 관심을 보인 글들을 우선순위가 돌려줄 것이다. 이렇게 순서가 정렬된 상태에서 겹치는 내용들이나 우선순위가 낮은 글들은 자연히 나의 “attention", 즉 관심 밖으로 밀려나게 된다.

attention.xml에 소셜네트워크의 파워를 추가해 보라. tag를 추가한다는 것은 결국 나의 관심 피드와 글들을 다른 사람들에게 알린다는 것이고 (반대도 마찬가지) 결국 이는 태그나 관심피드를 중심으로하는 관심분야 중심의 커뮤니티를 생성해 낼 것이며 이 커뮤니티에 속한 사람들은 계속 관심분야에 관한 정보를 생성해 내면서 다른 사람들이 서로 간접적으로 대화를 나누며 그 분야에 대하여 새로운 것을 배워가고 트렌드에 맞추어 “내가 오늘 새로 배워야 할 것은 무엇인가?"에 대한 상대적으로 정확한 힌트를 줄 것이다. 이를 한단계 더 발전시킨다면, 흔히 Collaborative Filtering 이라고 불리우는 아마존에서 “이 책을 산 사람들은 저 책도 샀습니다"와 같은 추천시스템을 만들 수도 있는 것이다.

매우 실용적인 용도를 생각해 보자면, 우리가 지금 OPML을 통해서 여러가지 RSS 리더를 넘나들면서 같은 피드목록을 유지할 수 있으나, 무엇은 읽었고 무엇은 읽지않았는가에 대한 것은 리더 사이에 조금도 싱크(synchronization) 가 되어 있지 않다. attention.xml 을 현재 OPML같이 import/export가 가능하다면 나는 리더와 관련이 없이 어디서든지 동일한 관점을 가질 수 있다.

attention.xml이 이런 정보관리능력향상에 도움을 준다고 해서 절대로 이것을 인공지능을 이용한 하나의 천재기계로 생각하면 안 된다. attention.xml은 어디까지나 정보소비자의 정보소비행동양식에 대한 최소한의 메타데이터일 뿐이고 대부분의 관리능력을 사용자 스스로의 행동에 대한 시간과 같은 객관적인 자료를 바탕으로 한 일종의 로그데이터로도 볼 수 있을 것이다. 따라서 attention.xml이 정보홍수속에서 허덕이는 우리들을 바로 빠져나오게 해줄 신적존재라고 믿는 것 역시 매우 위험한 생각이다.

5. 현재 상태와 앞으로의 outlook

attention.xml은 현재 두 가지의 현실적인 문제를 맞고 있다. 첫째는 open standard로 출발한 이 포맷이 과연 얼마나 전체적으로 받아들여지고 industry standard로 자리를 잡을 수 있을 것인가, 둘째는 과연 하나하나가 방대한 양을 가질 attention.xml 파일이 과연 애플리케이션에 의해 사용자가 원하는 속도만큼 빨리 처리가 가능할 것인가 하는 것이다. 지금 현재도 OPML 만을 사용하는 다음 RSS넷에 가면 전체 피드를 업데이트하고 읽지 않는 것들만 표시해주는대도 종종 30초는 족히 걸린다. 이런 시스템에세 각 피드와 아이템에 관한 사용빈도와 태그 등을 고려하여 모든 것을 계산하고 수백/수천개의 글들을 순서를 정렬하여 돌려주는 작업이 실시간 안으로 될 수 있을까 하는 의문이 먼저 드는 것이 더 자연스럽다고 할 수 있겠다.

그럼에도 불구하고 Gillmor와 Sifry의 멋지게 지속되고 있는 캠페인에 의하여 attention.xml은 여기저기서 보이기 시작하고 있다. 첫째는 rojo 인데, 이는 Bloglines 과 같은 온라인 RSS 리더이면서도 각 피드와 글에 대하여 tag를 추가할 수 있고 순서가 단순히 시간대 순서만이 아닌 나름대로의 추천 메커니즘에 기초하여 글들을 돌려주는 사이트있다. (인터페이스도 매우 깨끗하니 한번 들려보기를.) Technorati는 attention.xml 받고 업데이트할 수 있도록 해주는 attention.xml 웹 API를 제공하고 있다. NetNewsWire exporter 는 AppleScript를 이용한 attention.xml export 기능을 제공하고 있다. 얼마전에 구글 개인 검색에 대응하여 시작된 야후의 개인검색 역시 attention.xml 통한 데이터 나누기 기능을 실험하는 단계에 있다.

attention.xml을 처음에 반대하던 사람들도 결국에는 스스로 정보홍수 사태 때문에 attention.xml을 찬성하는 쪽으로 많이 돌고 있는 추세이다. 또한 attention.xml 은 하나의 스키마이기 때문에, 즉 어떤 것에 대하여 스스로 정의를 내리려고 하는 노력이기 때문에, 메타데이터의 가장 최소한적인 기능을 믿는 진영에서는 “너무 복잡하다", “너희가 정의한 것이 곧 바뀌어 버리면 그때는 어떻게 할거야?"라는 의문을 많이 받고 있기도 하다. 하여튼 지금 상황으로는 천천히 attention.xml은 그 세력을 확장할 것으로 보인다.

rojo.com
[Figure 2] rojo.com 의 tag sharing (그림크게보기)

6. 큰 그림과 그냥 들은 생각

위에서도 언급하였듯이, attention.xml 이 효율적인 정보관리에 대한 하늘에서 내려온 보약은 아니다. 단지, 정보의 양에 대해 너무나 지쳐버린 많은 사람들을 위해서 기본적인 것만 제시함으로 관리 효과를 왕창 늘리자 하는데 그 뜻이 있는 것이다. 때문에 attention.xml 의 부족했던 점을 보완하기 위해서 많은 유사한 노력들이 앞으로 보일 것으로 예상된다. 예를 들어 attention.xml 은 내가 가장 많이 읽는 블로그에서 가장 많이 사용되는 단어가 무엇인가 등에 대한 기록이 남지 않기 때문에, 다른 각도에서 정보관리능력을 향상시키려고 하는 사람들에 위해서 나름대로의 “경쟁” 스키마가 나올 것으로 보인다. 중요한 것은 RSS를 통해서 활짝 열린 정보의 시장에서 필요하고 원하는 것을 먼저 흡수할 수 있도록 하는 노력이 좀더 외형적으로 나타난다는 것이 매우 바람직한 현상이라는 점이다.

attention.xml의 발전단계를 보면서 또한 어떠한 것을 형식을 만들어서 표현한다는 것은 결국 그만큼 진입장벽을 높일 수 있다는 뜻이고 결국 표현력의 최소화를 주장하는 측에게는 반대를 받을 수 밖에 없다는 것이다. attention.xml의 specs 발전을 잘 보면 시맨틱웹에서 표현하려고 하는 많은 것들이 단순히 조금만 다른 형태로 표현되었다는 것을 알 수 있다. (예: rel/XFN -> rdf:FOAF) 웹에 있는 정보를 구조/체계화 시키자는 노력은 지난 번에도 말한 것처럼 가장 쉬운 것에서부터 시작하고 있으나, 결국에는 웹의 데이터는 의미를 이해할 수 있는 구조로 가야하고, web 2.0가 진화하면서 웹의 데이터구조는 결국에는 시맨틱웹 방향으로 나갈 것이라는 것이 더 굳게 믿어지고 있다.

마지막으로, 컴퓨팅이라는 불리우는 것은 더 이상 애플리케이션의 로직이 그 왕의 자리에 위치하지 않는다는 것이다. 정보와 데이터가 점점 중요한 위치에 서게 되면서 애플리케이션 비지니스 로직이라는 것은 단지 이 정보를 어떻게 그리고 더 효율적으로 처리할 것인가에 대한 위치로 점점더 밀려나게 된다는 것이다. attention.xml 파일 하나만 있으면 내가 글을 읽는 것이 Bloglines 이건 Sage 이건 다음RSS넷이건 상관이 없는 것 같이, 컴퓨팅의 중심에는 데이터가 서게 되는 것이다. 물론 모든 애플리케이션은 공통적으로 이를 처리할 수 있어야 하므로 표준이라는 것의 중요성은 날로날로 커져만 가고, IT업계 내에서의 진짜 전쟁은 누가 무슨 프로그램 만드냐가 아닌 누가 제시한 표준포맷이 시장을 지배할 것인가로 옮겨지게 되는 것이다.

7. 정리

내가 오랫동안 광고를 해온 attention.xml이 의외로 싱거운 실망으로 느껴질 수도 있겠다. 하지만 하루에 서너시간 동안 RSS 피드를 통해서 글을 읽고도 무언가 아쉽고 무언가 놓친것 같은 느낌이 나는 사람들의 기분을 두배로만 만족시켜줄 수 있다면, Gillmor와 Tantek의 이러한 노력은 절대로 가치가 없다고 볼 수 없을 것이다. attention.xml 은 단순히 정보를 더 효율적으로 다루어야만하는 우리 현대인의 상태를 잘 보여주고 있으며 블로그와 RSS를 통해서 시작된 web 1.0 보다는 훨씬 성숙된 정보혁명에서 우리가 더욱 똑똑한 정보소비자로 살아 남을 수 있도록 적지 않은 역할을 할 것이라고 믿는다.

8. 관련 링크
attention.xml specification
Waiting for Attention… or something like it
attention.xml 소개 자료
attention.xml 반댓글
attention.xml? what about attention.rdf?
yahoo search의 attention.xml 실험관련글
Gillmor Gang의 attention.xml 에 대한 대화 (mp3)
Steve Gillmor와 Robert Scoble의 attention.xml 산책 (mp3)

5/1/2005

이번주 소식 과 생각 정리

Filed under: — twdanny @ 1:03 am

firefox50
[Figure 1] 5천만 다운로드를 돌파한 Firefox

마지막 글을 올린지 5일밖에 안 되었는데, 너무나 오랜 시간동안 블로깅을 떠나 있었던 것처럼 느껴지는 것을 보니, 아마 심각하게 블로깅에 중독이 된 것이 맞긴 맞나보다. 지난 몇일동안 머리가 복잡한 일도 많고 신체적으로도 너무 기가 쇠하여(?), 글을 쓸 때마다 분석적으로 머리짜내기와 두세시간동안 자신과 싸움하게 만드는 태우’s log를 잠시 떠나 있었는데. 아니나 다를까, 오늘 밤에도 왠지 무언가를 올리지 않으면 허전할 것 같아 잠시 이번주에 봤던 것, 생각한 것들을 소개하는 수준에서 글을 올리려고 한다.

1) “웹애플리케이션 날다” 뜨다
likejazz 님이 웹애플리케이션 시리즈를 소개해 주셨다. likejazz님은 bloglines의 구독자수만해도 300명에 달하는 거대한 팬베이스를 자랑하시는 분인데, 미천한 나의 시리즈 1, 2, 3 편을 소개해주셨다. 대영광! 아울러 likejazz님이 그 중에서는 가장 관심을 가지고 계신 ajax 에 대한 멋진 연구자료를 여기서 찾아볼 수 있다. 감사합니다. (_ _)

2) podcasting 검색엔진
podcasting의 가장 큰 한계는 아무래도 모든 오디오 형식의 자료가 가지고 있는 검색성의 부족이다. 글은 텍스트이기 때문에 단순히 단어로 취급하여 검색엔진을 구성하기가 매우 쉬우나, 아직 이미지, 오디오, 비디오와 같은 멀티미디어형식의 자료들은 machine learning 등을 통한 확률적 접근방식 또는 그 정보에 대한 텍스트형식의 메타데이터 추가 (이글 참조) 방식 밖에 없다고 해도 과언이 아닌데. 이중 전자의 방식을 사용하여 text-to-speech 기법으로 검색엔진을 구성한 podscope 이라는 곳이 있어 눈에 띄고 있다. 검색을 해보고 그 결과를 보여주는데 우리가 흔히 익숙한 검색 match된 단어를 하이라이트 해주는 부분이 없어서 왠지 허전해 보이고 무엇보다도 그 결과가 맞았는지 틀렸는지를 전혀 알 길이 없어서 검색엔진의 효용성은 아직 검사해볼 수 없는 단계. 현재 machine learning 을 통한 음성->텍스트 변환은 대략 75%~80% 정확도 수준에 그친다고 한다.

3) Firefox 5천만 다운로드 돌파
어떠한 소프트웨어가 5천만개 사용되고 있다고 생각해 보자. 이 애플리케이션의 가격을 박스당 평균 25불이라고 하고 5천만개중 대략 20%는 불법유통, 그래서 실제로 4천만개 판매. 그러면, 4천만 * 25불 = 100천만불 = 10억불 = 1조원. 작년 엔씨소프트 + 다음 + NHN의 매출을 다 합친것보다도 훨씬 많은 가치를 Firefox는 불과 몇달만에 창출해낸 것이다. Firefox는 이미 웹브라우저 시장의 10%를 위협한지 한참되었으며, IT 기술에 조금이라도 관심이 있는 사람이라면 대부분 사용하고 있을 정도로 그 위력을 자랑하고 있는데.
오픈소스와 wikipedia, del.icou.us 등이 모두 공통적으로 보여주고 있는 현상은 바로 네트워크를 통해 생성되어 가고 있는 새로운 경제 플랫폼인 “참여의 경제"이다. 이 참여의 경제에서는 아무도 소유를 주장하지 않는다. 다시 말해, 소위 ‘공짜경제’가 나온다는 뜻이다. 그러나 이는 절대로 빌게이츠가 말했던 공산주의 경제를 뜻하지도 않는다. 왜냐하면 이는 가치가 없어진 것이 아니라, 가치가 위치만 이동했기 때문이다. 또한 이는 모든 것이 연결된 네트워크사회에서 자신만의 것을 찾아가는 개개인의 Long Tail 현상과 do-it-yourself 현상을 반영하기도 한다. (이와 관련된 Jonathan Schwarts의 speech를 들어보기. 나는 개인적으로 Schwarts의 안목과 통찰력에 다시 한번 감탄을 표했다.)
안타깝게도 이러한 참여/열린 경제의 모습은 아직은 배타적이고 단체주의적 모습을 종종 보이는 우리나라에서는 조금 더 시간이 지나야 성숙한 모습으로 나타날 것 같다.
Firefox를 위해서 불철주야로 노력하는 많은 여러분, 정말 축하드립니다!

4) 나의 정보관리 능력
얼마 전에 가졌던 likejazz 님과의 대화도 있지만, 분명한 것은 우리들 중 수많은 사람들이 정보의 홍수속에서 중독되어서 살아가고 있다는 것이다. 할일이 많은 사람은 시간관리, 우선순위 관리능력이 필수인 것 처럼, 흡수해야할 정보의 양이 많은 사람은 나에게 중요하고, 필요한, 유익한, 관심분야와 관련된, 중복되지 않은 정보만 쏙쏙 뽑아서 흡수할 수 있는 능력이 21세기 지식사회를 살아가는 데 있어서 생존능력과 직결된다고 볼 수 있다. (물론 더 요구되는 능력은 단순히 정보의 흡수가 아니라 이 정보를 어떻게 내 것으로 만들어 새로운 지식을 창출해 내는가에 있지만)
우리가 요즘 흔히 듣는 말: “나는 하루에도 읽어야할 RSS feed가 너무나 많아요. 채널만 100개가 넘고요, 한 이삼일 잊고 지내면 쌓여있는 feed가 1000개가 넘어요. 미치겠어요.” 너무 먼 얘기같이 들리지만은 않는다고?
web 2.0 분야에 관해서 깊은 통찰력을 보여온 ITConveration Gillmor Gang의 리더 Steve Gillmor가 오랫동안 생각해온 방법: attention.xml 을 다음번까지 기대하시라!

4/26/2005

것봐요, 내가 모라 그랬나요, 미스터 셔키!

Filed under: — twdanny @ 12:03 am

del.icio.us 에서 bundle이라는 서비스를 베타버전으로 제공한다고 한다. “번들"은, 여러개의 태그를 하나의 다른 태그 밑으로 묶어 놓을 수 있는 기능이다. 위의 링크에서 들은 예를 보면, humor라는 태그 밑에 parody, sarcasm, puns 묶어 놓을 수 있다고 한다.

(오늘은 정말로 일찍 자기로 마음 먹었으므로 맛보기만)
블로깅 등에 의하여 웹은 전보다도 더 방대한 양의 살아있는 정보를 실시간으로 생성해 내기 시작했고, 이에 따라서 정보의 소비자인 우리들은 이제는 정말 원하고 필요한 정보를 찾아내는 것이 필수가 되어 버렸다. 단순한 키워드 매칭은 우리가 원하는 정보를 제공하는데는 한계가 있음을 이미 수년전에 우리에게 보여줬고, 이에 따라 자연적으로 정보를 구조화시키고 체계화시킴으로서 웹을 일종의 도서관같은 시스템으로 만들어가려는 노력이 점점더 눈에 띄게 나타나고 있다. 물론, 웹과 도서관의 궁극적인 차이는, 웹은 bottom-up 이라는 점, 따라서 언제 어떤 변화가 나타날지 모르나 항상 틀을 깨는 아이디어와 인간행동양식이 지배를 하고 대신 질이 낮은 정보(예: 스팸)도 그만큼 쉽게 다닐 수 있는 통로가 많다는 점, 반면 도서관은 소수정예의 “정보전문가"들이 정보를 정리하고 자신들의 전문지식을 동원하여 “평민"들이 정보를 가장 효율적으로 흡수할 수 있도록 시스템을 갖추고 있다 (이러한 방식의 가장 큰 단점은 물론, 전문가들에 의해 만들어진 정보분류체계 시스템이 새로운 분야나 트렌드에 의해서 깨질 때 유연성을 갖기 어렵다는 점에 있다). 하여튼, 웹상에 존재하는 대량의 정보를 조금이라도 쉽게 찾고 효율적으로 내것으로 만들기 위해서는, 많은 사람들이 동의하듯, 우리가 원하는 정보에 대한 정보, 즉 메타데이터를 활용하는 방법이 있다. 메타데이터부터 시작하는 정보체제구축에는 수준이 낮은 단계부터 높은 단계까지 존재하는데, 이 사다리에 바닥에 존재하고 있는 방법이 바로 태깅인 것이다.

태깅은 원래의 리소스와 태그와 관계에 대해서는 아무것도 정의하지 않는 형태의 정보분류법이다. 예를 들어, 나의 블로그 사이트에 “web 2.0″라는 태그를 붙였다면, 이것은 단순히 twlog.net과 web2.0 사이에 어떠한 관계가 존재하지만, 그 관계가 어떤 것인지는 알 수 없는 것이다. 심지어는, 어떤 연예인의 홈페이지에 연예인의 이름이 태그로 붙을 수도 있고 동시에 안티페이지 역시 같은 태그로 붙을 수도 있는 것이다. 태깅이 지금까지 그토록 성공적인 가장 큰 이유는 진입장벽이 매우 낮기 때문이다. 어떤 정보를 습득했을 때, 이것저것 정의할 필요없이 단순히 단어나 문구하나만 더해주면 자동으로 메타데이터로 생성이 된다. 이렇게 진입장벽이 낮은 정보분류시스템 때문에 많은 사용자들이 이를 사용하게 되고 결국 소셜네트워크의 힘을 빌어 이렇게 하는 사용자의 수가 크면 클 수록 태깅의 파워는 커지게 되는 것이다.

그러나 태깅의 힘은 여기에서 멈추게 된다. 더 이상 아무런 표현력이 없다. 예를 들어 “핸드볼"이라는 태그가 존재하고 “스포츠"라는 태그가 존재한다고 해보자. 이 두 태그의 관계는? del.icio.us 에는 이 둘이 만약에 공통적인 링크를 많이 함유하고 있다면 “related"라는 표시를 해주지만, 대부분의 우리가 알고 있는 “핸드볼은 스포츠의 일종이다"라는 개념은 절대로 유추해낼 수 없다. del.icio.us 번들은 이러한 태깅의 의미표현력의 한계점을 보완하기 위해 고안된 방법이다. 아직 bundle도 정확한 관계를 표현해주지는 않는다. 흔히 온톨로지에서 사용되는 IS-A (일종의), 또는 PART-OF(일부분의) 등의 관계는 표현되지 않고 단지 A라는 태그와 관련된 태그가 B, C, D 등이 있다것 까지만 보여준다.

의미 표현력이라는 면에서 이는 온톨로지에는 미치지 못하는 RDF의 Bag개념에 가깝다. 셔키아저씨는 “see, it’s still not ontology“라고 말할지도 모른다. 하지만, 한가지 확실한 것은, “it’s getting closer “이다. tagging 이라는 것의 한계에 신물이난 del.icio.us의 파워유저들을 위해서 flat-space의 태깅에 좀더 복잡성을 더해준 그래서 온톨로지에 한발짝 더 다가가는 bundle이 기능이 나오고 있고, 머지않아 여기에서도 표현력의 한계를 느끼기 시작하는 사용자들을 위해서 관계정의적(반대말, 일종의, 일부분의, 동질의 등등) 태깅이 나올 것이라고 믿는다.

4/19/2005

웹애플리케이션, 날다 (2)

Filed under: — twdanny @ 11:51 pm

(웹애플리케이션, 날다 (1)에 이어서)

“When I think about competitors, there’s only one I really worry about,” Chizen said in an interview a year ago. “Microsoft is the competitor, and it’s the one that keeps me up at night.”
– Bruce Chizen, CEO of Adobe. via CNET News.com

웹이 문서의 집합에서 애플리케이션과 사회상호작용을 위한 플랫폼으로 자라나면서 웹애플리케이션이란 풍부한 기능을 가진 플랫폼의 중요성은 이루 말할 수 없이 커져만 가고 있다. AdobeMacromedia의 합작 (물론 하나가 다른 하나를 인수했지만, 하여튼) . 마이크로소프트를 견제할 또 하나의 거대 세력으로 등장하는데.

이 M&A 가 합법적으로 성사될지에 관해서는 많은 의문들이 여기저기에 있다. PDF 와 플래시가 워낙 많이 사용되는 표준이다 보니 이 둘의 합작은 독점으로 찍혀버릴 가능성이 매우 높기 때문이다.

마이크로소프트의 Longhorn, Adobe/Macromedia의 Flash/Dreamweaver/Photoshop/GoLive/PDF/Illustrator군, Laszlo, Ajax, W3C의 SVG…. 이는 모두 웹을 좀더 풍부한 컨텐츠 제공 플랫폼으로 만들어가려는 표준 전쟁의 일환이다. 웹멀티미디어에서 왕좌에 앉은 Flash의 Macromedia 이여서 그렇겠지만, 심지어는 SVG의 페이퍼에 대해서 Macromedia 혼자서 기여하지 않았다고 한다. (이에 비해, 오랫동안 Macromedia와 전쟁을 벌여온 Adobe는 반대로 표준을 잘 따르려는 편인지 SVG 플러그인 지원과 PDF에 RDF 심기 등 W3C의 많은 활동을 현실화하는 작업에 동참해 왔다.)

성공기업의 딜레마(원작: Innovator’s Dilemma by Clayton M. Christensen)를 보면 Proprietary, 자신만의 표준/기술을 보유한 기업들이 왜 시간이 지나면 자신의 시장에서의 점유율을 이어가지 못하는지에 대한 자세한 설명이 있다.

지금 이 둘이 하나로 합쳐지는 이 상황에서 과연 이들은 Microsoft 를 대적하면서도 Microsoft 와 같은 길을 걸어갈 것인지 아니면 Google과 IBM과 같이 ‘열려진’ 세상에서 최대의 가치를 찾는 방법을 찾을 것인지, 지켜봐야 할 것 같다.

Adobe/Macromedia 인수/합병에 대한 한국 블로거들의 반응:
- Macromedia and Adobe, Jeremy Allaire’s Perspective from likejazz
- Adobe의 Macromedia 인수를 환영한다 from 폐인희동이의 폐인촌
- Adobe가 Macromedia를 34억 달러로 매수 from 포드캐스트
- Macromedia + Adobe System = ??!? from 홀릭프로젝트
- 어도비, 플래쉬의 매크로미디어 인수 from 빨빤의 일상 다반사
- 금붕어, 고래를 삼키다 from 거친마루 카리스마

4/17/2005

오마이뉴스의 놀라움

Filed under: — twdanny @ 3:40 am

oh my news

방금 한시간 반에 걸쳐 글을 쓰다가 마우스 클릭 하나 잘못해서 글이 그대로 날아가버리는 것 때문에 매우 심기가 불편한 상태. 그냥 잤어야 하는건데. ㅡ.ㅡ+

쓰던 글을 아주 짧게 줄여보자면 RSS 피드 구독하기와 웹브라우징에 관한 글이다. 대략 주제는 web2.0에서 그토록 외치는 RSS 구독을 통한 글읽기가 한국에서는 왜 실현되지 않고 아직도 웹브라우징 위주로 정보의 전달이 이루어지는가에 대한 것이였다. 가볍게 예를 들은 것은 내 블로그가 블코 어제의 인기글 top5 1위로 올랐을 때 그 글의 클릭수가 300을 가볍게 넘었음에도 불구하고 내 RSS 피드 구독수에는 전혀 영향을 미치지 않았던 점을 들었었는데.

이러한 현상을 분석하면서 이 자료 저 자료를 찾아다니다가 깜짝 놀란 것은 바로 다음 RSS넷에 등록되어 있는 오마이뉴스의 구독자수가 7,000명을 한참 넘는 다는 사실이다 (더 정확히는 7,180). 이는 한국 최고 영향 언론인 조선일보 feed 구독자수인 915명의 거의 8배에 달하는 수치이며, 우리나라에서 개인블로그로서는 아마 “최고"라고 할 수 있는 hochan.NET (159)의 45배인 동시에 Bloglines 상에서 최고 구독수를 자랑하는 New York Times (11,288), Wired (24,972), Gizmodo (15,250) 등에도 꿀린다고만은 할 수 없는 “자랑스러운” 숫자이다.

오마이뉴스는 그 비지니스 모델을 Long Tail 현상에서의 “niche writers"에 두고 있다. 40,000명이라고 하던가? 하여튼 이러한 어마어마한 수의 시민기자를 보유와 협력하면서 그들 (또는 “민중")의 관점이 충분히 반영된 글을 제공함으로써 공급에서의 틈새(niche)를 극대화시키는 효과를 가져오려고 하는 것이었고 그만큼 성공적인 결과를 우리에게 보여주고 있다.

근데 내가 7,180라는 숫자를 보면서 가장 놀랐던 점은, 오마이뉴스에게 나타난 수요의 면에서도 보이는 긴꼬리 현상이다. 오마이뉴스가 소수의 기자에 국한되지 않는 다수의 관점과 목소리를 제공한다는 점 때문에 정보의 소비자 역시 다양한 종류의 층을 형성하게 되었을 것이다. 내 생각에 7,180명은 모두 같은 분야에 관심이 있기 때문에라기보다는 다양한 관심을 가진 사람이 자신이 원하는 다양한 관점을 찾으려고 하나의 피드를 구독하고 있으며 이 “다양한” 소비자의 수는 생각보다 훨씬 컸다는 결론을 보여주고 있다.

물론, 다음 RSS넷에서 피드 검색 창 하나가 없다는 사실과 뉴스분야의 RSS피드로 올려놓은 것이 조선, 중앙,오마이뉴스, 일간스포츠, 이 넷 밖에 없다는 점이 바로 지수법칙을 불어내도록 한 효과가 크다는 점과 흔히 불리는 “1인미디어라"는 점을 블로그와 오마이뉴스가 공유한다는 점을 볼 때 그리 놀랄만한 사실은 아닐수도 있겠다.

하여튼, “한국 사람들은 제발 RSS 피드로 글을 구독하시길 바란다."라는 주제로 글을 쓰면서 RSS 구독수가 매우 적음을 지적하려고 했던 나에게 7,180이라는 수는 초자연적인 수로 다가왔으며 오마이뉴스를 평소에 구독하지 않는 나에게 Long Tail 현상을 보여주고있는 우리나라 정보 소비자들에게 다시 한번 경의를 표한다.

4/13/2005

RSS 블로그 이외의 사용

Filed under: — twdanny @ 12:52 am

Read/Write Web 에 올라온 ‘RSS not only for blogs‘.
이 글에는 블로깅 이외에도 RSS가 어떻게 사용될 수 있는가에 내용이 담겨져 있다.

얼마 전에 소개한 글에서 처럼 RSS는 단순히 정보를 알리는 syndication 기능 뿐만 아니라 어떤 대상에 대한 정보를 표현해주는 metadata의 기능도 가지고 있는데.

그동안 내가 RSS가 폭넓게 어떻게 사용될 수 있는가에 대한 부분을 잠시 정리하여 윗글에 comment 로 올려놓은 것을 아래에 잠시 붙여넣기.

—————————–

Three things regarding the non-blogging use of RSS.

1. Product announcments for the shopping sites. It’s been mentioned already, but too often what I’m more interested in is not the collection of every single product from a single shopping site, but rather a certain category of items or one item from different sites. In order to achieve this, you could have something like, “http://www.amazong.com/feed/q?keyword=rss", which delivers a feed of all products which are related to rss. Even better, throw in the rip/mix/burn of feeds (yeah!) only on one category from various shopping sites. There you have the best feed which contains most, if not all, up-to-date product announcements related to rss. I’m quite positive, in the next few months, as the number of product-related feeds increases, we’ll be seeing some meta-shopping sites coming into life, which provide the services I just described.

2. Sportcasting feeds and real-time delivery.
I developed for my master’s project a pub-sub model for sportcasting, which basically delivers real-time scores of the games. One problem I had with this model was that the update rate had to be extremely fast in an environment like this, probably the same with stock-tickers. I don’t know how often the Bloglines tracking system updates the feeds, but RSS might not be the best model for “real” real-time updates. For example, every time I “watch” an NBA game on ESPN, the update periods are usually 30 seconds, and I feel even that is a little too long. 30 seconds might not be too bad for a desktop RSS reader, but I assume there’s practically no way that an online aggregator can update those feeds in less than a minute, not knowing which one has to be updated that frequently. I believe Bloglines update period is about 30 min. (if i’m wrong on this, please correct me)

3. RSS within an Intranet
Anything becomes a much more difficult problem when it comes to a business application. The same goes for RSS. The thing about RSS is that it’s ON THE WEB, meaning anyone can access it as long as it has a URL. This cannot be tolerated within a business application. There should be ways to add in access control lists and security mechanisms so that the feed itself, if not the server on which the feed resides, can determine who can read and who cannot. I feel like this will require lots of experimentation and trial-and-errors.

4/9/2005

rss의 두가지 얼굴

Filed under: — twdanny @ 6:04 pm

danny ayers 왈,

But there are two complementary sides to syndication technologies. There’s the distribution side (RSS is a cut-down version of HTML, a timed-download opt-in pub-sub protocol and a variation on tabbed browsers) and there’s the metadata side (RSS is a resource description vocabulary). The combination is potentially very powerful indeed

4/7/2005

메타데이터의 미(美)

Filed under: — twdanny @ 1:38 am

iPod Shuffle로 podcasting 듣기는 역시 그리 쉽지많은 않은 일이다. 액정이 없는 관계로 매 파일을 들을 때 마다 몇초를 기다려 가며 어떤 파일인가를 확인해야하니. 내가 듣는 모든 mp3 의 반 이상이 ITConversations 일 정도로 여기서 많은 파일들을 듣고 있는데.

ITConversations 의 프로듀서인 Doug Kaye 가 형식을 바꿔서, 파일이 시작되기 전에 아주 짧게 “이 mp3 는 무엇무엇에 관한 것이다” 설명을 해준다. 이 때문에 더이상 나는 매 파일마다 10~20초씩 더 기다릴 필요없이 맨앞 2초만 듣고 어떤 파일인지 단번에 알게 되었다.

데이터에 관한 데이터.

이것이 바로 메타데이터이다.

2/21/2005

RSS 생성하기

Filed under: — twdanny @ 7:57 am

web 2.0, web as platform, 은 기본적으로 가정하고 있는 부분이 하나가 있다.

이는 바로, 컨텐츠 또는 정보가 생성된다는 점이다.

표현이란 인간의 가장 근본적인 욕망 중 하나이기 때문에 정보는 계속 생성될 것이 뻔하다.

그러나, web 2.0의 플랫폼, 또는 그로 인해 생성되는 새로운 정보 채널을 이용하지 않고
정보를 생성할 경우에는 그만큼 스스로 정보의 구독자 숫자를 줄여나가기 위해
발버둥 치는 것과 마찬가지이다. 그만큼 기술은 바뀌어 가고 있기 때문이다.

한명이라도 더 많은 클릭수를 유도하려고 노력하는 마케팅 사이트들.
이 말을 들으라.
(Robert Scoble의 Scobleizer에서)

물건 한개라도 더 광고하고 판매하려고 하는 쇼핑몰 사이트들.
이 말을 들으라.

2/4/2005

쇼핑몰과 RSS

Filed under: — twdanny @ 12:02 am

나는 국내 많은 쇼핑몰 사이트에 가입되어 있다.
주요 쇼핑몰 사이트는 거의 모두 회원이라고 봐도 되는데.
(몇개의 예를 들자면, 옥션, LGeShop, 인터파크, gMarket, KTMall 등등)

이 사이트들이 운영적인 측에서 모두 공통적인 것이 하나가 있는데, 이는 바로 상품과 이벤트/세일 등에 관한 메일을 꾸역구역 보내준다는 것이다.메일을 보다보면 “싼” 상품으로 가득찬 경우도 많이 있고, 이벤트에 두 눈이 번쩍할 때도 많이 있다.

문제는 메일로 날아와서 소개되는 상품의 근 90%는 내가 거들떠 보지도 않는 상품이라는 점이다. 나에게는 가치없는 이런 상품들에 관한 정보로 가득찬 메일을 일주일에도 수십통씩 받아보면서 메일용량을 채워가는 일은 사실 정보의 소비자로서는 그리 기쁜 일만은 아닐 것이다.

그런데 여기서 그럼 내가 보는 10%의 상품들은 어떤 상품인가? 무조건 싼 상품? 아마도 그렇지는 않을 것이다. 왜냐하면 보석들은 아무리 싸도 나의 관심을 산 적이 없으니까. 내가 보는 상품은 바로 내가 관심있는 종류의 상품들이다. 컴퓨터, mp3p, 남성캐쥬얼/정장, 음악CD, 도서 등. 정기구독되는 메일은 이것들 뿐만 아니라 나머지 모든 종류의 상품을 다 소개한다.

그것도 나의 의사와 관련이 없이 자기네들이 원할 때 메일을 발송하여 내가 받게 만든다. 물론, 이 물건 저 물건을 한 곳에 진열하여 사람들에게 충동구매를 하면서 물건을 사게 만드는 것이 그들의 커다란 전략중 일부인 것을 충분히 이해하고 있으나, (또한 이를 위해서 수많은 UI 도사들을 모아놓고 보내는 메일하나하나를 밤새가며 디자인한다는 것까지) 자기네들 역시 열심히 시스템 자원 낭비해 가면서 보내는 정보가 소비자/사용자들에게 별로 가치가 없다면 이것은 정보의 낭비요, 에너지의 낭비요, 메일 수신인 저장용량 낭비요, 결국 효율적이지 못한 홍보/광고전략이 되는 것이다.

web 2.0의 세계의 성공핵심전략은 바로 웹세계의 중심에 정보의 생성자가 있는 것이 아니라 정보의 소비자가 통제력을 가지고 있다는 것이다. 이는 마치 지난 10년 동안 마케팅의 촛점이 제품에서 고객만족으로 옮겨간 것과도 유사하다. 정보의 고객에게 있어서 가장 중요한 요소는 아무래도 양질의 정보를 생성해 내는 것이요, 정보에서 양질이라는 뜻은 상대적으로 그 사용자가 원하는 정보를 제공한다는 것이요, 이를 위해서는 사용자에게 통제력을 허락해 준다는 뜻이요, 이는 곧 사용자가 원하는 정보만 골라서 가져갈 수 있도록 옵션을 제공해준다는 점이다.

많은 이메일 뉴스레터들이 내용에 따라 한 정보제공자 내에서도 여러가지 종류의 뉴스레터 구독이 가능하게 한다. 예를 들어, oreilley.com 만 하더라도 onjava newsletter, xml.com newsletter, network newsletter, media newsletter 등 “취향에 따라” 원하는 뉴스레터를 구독할 수 있다. 이는 사용자의 편의를 위하는 것도 있지만, 정보흐름의 세계에서는 정보의 도착지인 정보의 소비자가 얼마나 중요한지 다시 한번 보여주는 단적인 예이기도 하다.

RSS 는 이러한 목적을 위해 탄생한 도구이다. 그럼에도 불구하고 RSS는 아직 걸음마 단계를 벗어나지 못해서 예전에 홈페이지들이 사용자를 고려하지 않고 페이지를 디자인했듯이 정보의 구독자를 고려하지 않고 원하는 정보를 원하는 형태로 출판해내고 있다.

RSS가 웹애플리케이션인 이유는 URL을 통해서 가져오기 때문이다. 이 URL은 단순히 파일이 아니라 URL 문법에는 query가 들어갈 수 있으며 이는 곧 사용자에 의해 선택된 동적인 RSS 생성이 가능하다는 뜻이다. 예를 들어서, LGeShop 에서 나오는 상품 중 내가 원하는 것은 “삼성센스노트북"이라면, 그 RSS 피드를 http://www.lgeshop.co.kr/rss/feed?keyword=삼성센트노트북와 같은 동적인 것으로 만들어서 이 단어가 들어간 정보만 보내주는 것이다.

이는 우리 정보 소비자에게 어떤 효과를 가져올까?
내가 등록한 쇼핑 사이트가 10개라고 하고 이곳에서 받는 메일이 일주일에 10건이라고 해보자. 10건이 올 때마다 메일을 개봉하여 페이지 가장 아래까지 스크롤하면서 혹시 나의 관심 품목이 있는가 없는가 보다가 다른 관심없던 것도 보고, 그러다가 시간 다가고 결국 내가 원하는 것은 찾지도 못할 때가 태반일 것이다. 반면 rss 채널을 10개를 등록하고 각 채널이 내가 원하는 품목에 관한 정보만 rss로 배달해준다고 해보자. 나의 rss 구독기에서 클릭해보면 그 상품에 관한 정보만 실시간으로 업데이트되는 것을 찾을 수 있다. 다른 쓸데 없는 것에서 시간을 낭비할 필요도 없다.

더 좋은 것은, (아직은 너무 이르지만)나중에 rss 기술이 발달하여 여러 채널을 하나의 채널로 통합하여 볼 수 있다면,내가 동일 상품관련정보에 관하여 소비하는 시간은 “삼성센스노트북"이라는 상품에 대하여 일주일에 10통씩 메일을 받아보고 거기서 위와같이 쓸데없는 거 보면서 낭비하는 시간에서, 단순히 하루에 한번정도 단 하나의 rss 채널을 확인해보는 것으로 줄어들게 된다.

시간이 지날수록 각 정보생성 포탈과 사이트들은 생성하는 모든 정보를 RSS화해야할 것이다. 이는 단순히 블로그채널 뿐만이 아니라, 뉴스채널, 증권실시간채널, 스포츠중계채널, 대학입시발표채널, TV편성표채널, 내가 등록한 길드 게시판의 신규 게시물등 폭넓은 곳에 이를 것이다.

기계가 소비하고 인간을 위해서 처리포장해주는 웹, 이를 위해서 웹의 구조 자체를 단순히 html 페이지 링크에서 플랫폼으로 변환시키는 것.

이것이 바로 web 2.0이다.

1/22/2005

다음 RSS넷에 대한 나의 입장

Filed under: — twdanny @ 11:04 pm

찬성이다.

물론 다음이 다른 블로거들의 정보를 이용하여 돈을 벌려고 했다는 점을 수많은 블로거들이 싫어하는 것은 이해하나, 어차피 RSS의 탄생에 의해서 이메일을 통한 정보채널은 줄어들 것이고,지메일, 파란메일 때문에 자기네들의 최대 수입원인 한메일의 사용량 역시 이에 따라 줄 것이고,따라서 새로운 정보채널인 RSS 리더 서비스를 제일 먼저 한국에서 오픈해서, 그 채널 통로에서 톨 받아먹고 살겠다는데. 다음은 그런 걸 통해서 돈을 벌어서 먹고 살아야 하는 회사이고, 그런 면에서 rss 리더를 내가 국내 포탈중 기술적으로 조금 뒤쳐져있다고 믿었던 다음이 제일 먼저 제공했다는 점에서도 한국에 새로운 정보수맥을 열어준 업적이라고 생각한다. 사실 나름대로 이 서비스를 개발한 개발자들은 한국에서 정보도 더 매끄럽게 흘러가도록 하는 꿈과 비전을 가지고 최선을 다해서 만든 서비스라고도 생각해 보는데…

rssnet
[Figure 1] 내가 가끔 들리는 나의 rssnet. 태우’s log의 유일한 구독자는 나 자신뿐이다.. ㅡ.ㅡ;

웹은 URL (시맨틱웹에서는 확장된 개념인 URI)에 의해서 작동한다. 무슨 뜻이냐면, 문자열 몇글자면 모든 것이 접근 가능해진다는 뜻이다. 만약에 사용자들이 정말로 정말로 정말로 정보보호를 원한다면, 다음카페,네이버카페싸이월드와 같은 거의 완전히 닫힌 시스템으로 전환해야 한다. 단순히 이들이 URL 기반으로 링크들이 작동하지 않는다는 뜻으로.

사용자들이여 웹을 알거라.
웹은 링크하나로 모든 것이 접근가능하게 하는 것을 비전으로 만들어진 발명품이란다. 다음 RSS넷이 그렇게 싫다면, 세계적으로 블로깅에 혁신을 가져온 bloglines을 싫어하고, 웹상에 존재하는 어떤 것이나 먹어치우고 저장하고 공개하고, 그것 때문에 당신들이 원하는 정보를 언제든지 찾고 인생을 개선하는데 사용하게 도와주는 구글을 미워해라.

다음은 (no pun intended) 거북거북월드님의 블로그글에 대한 나의 의견 글.

————————————————–

저 역시 왜 반대하는지 이해가 안 갑니다.

음, 사실은 이해는 많이 가지만 반대하는 분들의 이야기는 조금 앞뒤가 맞지 않는 것이 많은 것 같네요.

많은 분들이 얘기하는 것들이 “니가 누군데 내 글 퍼다가 올려 놓는 것이야?” 하는 것 같은데요. 물론 블로거들이 아직 몰라서 그런 이유가 가장 크겠지만 웹상에 이미 글을 올린다는 사실, 그리고 무엇보다도 RSS로 이미 정보를 제공한다는 사실은 누구에게나 이 글을 볼 수 있는 권리와 RSS를 가져가는 것을 허락을 하는게 아닐까요?

웹상에 공개해놓은 후에 남들이 보면 싫어한다는 것은 마치 명동 한복판에서 나체로 걸어가면서 사람들이 쳐다보면 다 나쁜놈들이라고 하고, 지나가던 기자가 사진을 찍으면 죽일 놈이라고 하는 것과 마찬가지라고 생각합니다.

한국의 모든 블로거들은 이미 다음에서 RSS로 글을 가져가고 캐쉬를 하기 아주 오래전에 구글 데이터베이스내에 모든 자료가 기록과 영구보존되며, 검색시 세계 수십억 인구에게 공개된다는 것을 알고 있어야 할것 같습니다.

사실 어떻게 보면, 개인 프라이버시를 문제 삼고 싶다면 RSS/XML을 제공하고 있는 블로깅 서비스 제공자들을 더 욕해야 겠지요. 물론 제 개인적인 입장에서는 이들도 욕먹을 대상은 아닙니다.

결국 가장 큰 책임 자체는 블로거들에게 있는 것이고 이를 위해서 블로깅(뿐 아니라 모든 웹을 통한 미디어 형태) 서비스들은 사용자에게 더 강력한 정보접근권한설정기능을 제공해줘야 하겠지요.

publishing something on the web = telling that something to the whole world

11/2/2004

한국 RSS feed 모음

Filed under: — twdanny @ 1:24 pm

http://www.codeordie.org/wiki/?LinkPage/RssFeed

전에는 아는데가 조선, 한겨레 이 둘 밖에 없어서,
오랫동안 찾았었는데..

드디어 찾았다!!

11/1/2004

ATOM-OWL

Filed under: — twdanny @ 10:46 pm

atom-owl

단순히 신디케이션 형식을 넘어선 좀더 풍부한 온톨로지 형식으로서의 재탄생.

특히 시맨틱웹 세계에서 내가 보기에는 가장 글도 많이 쓰고 참여가 많은 사람 중 하나인
Danny Ayers에 의해 만들어지고 있다는 것이 무엇보다도 신뢰가 간다.

Powered by WordPress