[시맨틱웹] 3. 꼭 RDF를 사용해야 하나요? XML 으로도 충분해 보이는데.

Saturday, July 23rd, 2005 at 10:25 pm

Q:
XML의 상용화는 IT업계 전반적으로 혁명을 가져왔다고 해도 과언이 아닙니다. 엄청난 양의 정보가 XML의 형태로 생성되어 지고 있으며 이러한 추세는 앞으로 더욱 증가할 것으로만 보이는데요. 시맨틱웹의 목표가 웹상의 정보를 정형화하는 것이라면, 이미 자료를 정형화시켜줄 수 있는 틀을 제공하는 XML과 XML스키마를 쓰는 것이 굳이 RDF라는 새로운 데이터모델을 만드는 것보다 훨씬 나은 방법이 아닌가요?

A:
위의 질문은 RDF의 탄생활동 초기부터 나온 의견입니다. 특히 XML의 상용화가 폭발적으로 일어나고 있는 요즘 더욱더 내공이 쌓인 의견이라고 할 수 있죠 ^^ 이 이슈를 좀더 자세히 분석하기 위하여 먼저, XML이라는 데이터 모델과 RDF라는 데이터 모델의 근본적인 특성과 차이점을 알아봐야 하겠습니다.

XML
1. 표현대상: 문법 (syntax)
2. 구조: 트리 구조 (hierarchy, 수직구조)
3. 독립적 데이터 표현 형태로서 간결한 문법구조를 가지고 있음
4. 외부 데이터로서의 연결성이 확장성 결여

RDF
1. 표현대상: 의미 (semantics)
2. 구조: 정점(node)와 변(edge)로 구성된 그래프 구조 (graph mode, 수평구조)
3. URI로 대표되는 웹상의 리소스 사이의 관계를 중심적으로 표현
4. 그래프 모델의 특성상 수직구조로 변환은 쉽지 않으나 연결고리를 중심으로 넓게 분포된 관계중심 데이터를 통합 가능

이 두 모델을 위와 같이 비교해 보면 결국 결론은, XML과 RDF는 두 개의 독립 모델이며 따라서 누가 더 훌륭한 모델인가는 “그때그때 달라요”라는 것을 알 수 있습니다. XML은 그 문법에 간결함과 튼튼한 트리구조 때문에 어떠한 독립 정보 객체를 표현하는데는 적격이라고 할 수 있겠죠. 반면 RDF는 그 모델이 가장 중요한 부분이 바로 Property (그래프에서는 화살표에 해당하는 edge부분)로 대표되는 연결성이라고 할 수 있습니다. 이러한 연결성을 따라가다보면 결국에는 수평적이고 분산적인 정보의 세계로 무한확장이 될 수 있는 것을 알 수 있습니다. 정보를 일단은 정형화된 형태로 표현하는 것이 매우 중요한 요즘 아직 연결고리를 중요시하는 RDF 보다는 XML로 많이 표현되는 것이 자연스러운 것이라고 할 수 있겠습니다.

여기서 잠시 짚어봐야할 것이 있는데요 이는 바로 웹의 기본 성질인 “연결성”입니다. 현재의 웹도 그 중심에는 “연결성”이라는 정신이 존재하고 있습니다. 바로 우리가 마우스로 클릭하여 옮겨가는 또 다른 HTML 문서를 뜻하는 것이죠. 이는 시맨틱웹에서도 마찬가지입니다. 정보는 컴퓨터가 이해할 수 있는 형태로 표현하되 그 “연결성”의 본질은 잃지말자는 것이죠. 이러한 연결성에 바탕한 구조는 위에서 언급한 것과 같이 무한확장이라는 장점을 가지고 있습니다. 이를 통해 어마어마한 양의 다른 종류의 정보를 수집, 통합이 가능해질 뿐 아니라, 이렇게 모아진 정보는 마치 RDB 하나에 모든 것을 모아놓은 것처럼 원하는 대로 쿼리를 통해 검색을 할 수도 있는 장점을 낳죠. 이런 점을 최대한 살리기 위하여 시맨틱웹은 RDF를 그 뼈대로 삼은 것입니다.뿐만 아니라, RDF로 표현된 데이터는 OWL로 확장이 되어 궁극적으로 논리법칙을 적용하는데에도 사용될 수 있다는 장점을 보너스로 부여받게 되지요.

XML vs. RDF 이슈에 들어오게 되면 항상 올라오는 RDF 반대파의 무기가 있는데요 이는 바로 RDF/XML 문법이 너무나 알아보기 힘들게 복잡하고 지저분하다는 것입니다. RDF형태로작성되는 RSS 1.0와 단순 XML 스키마 형태로 작성되는 RSS 2.0 의 차이만 보더라도 알 수 있는 부분인데요. 이는 수평모델인 RDF그래프를 수직구조인 XML 트리로 끼워 맞추면서 맞지 않는 부분이 많이 있기 때문에 나타나는 현상이라고 볼 수 있습니다. 그러나 여기서 XML파(?)는 중요한 것을 잊고 있는데요, 이는 바로 XML이 RDF의 유일한 표현방신이 아니라는 것입니다. 이미 serialization 이라고 불리는 RDF의 표현방식은 여러 개가 존재하고 있으며 그중 일부 형식들은 매우 간결하면서도 동시에 RDF의 본래 장점을 충분히 살려주는 문법을 가지고 있습니다.다시 한번 강조하는 것은, RDF에게 있어서 가장 중요한 것은 그 표현 방식이 아닌 연결성과 관계성을 중심으로 한 그래프 모델이라고 할 수 있습니다.

그렇다고 XML이 시맨틱웹 세계에서 설 곳이 없는 것은 절대로 아닙니다. XML는 본래의 목적인 문서 표현을 위해서 가장 효율적이고 알맞는 형식입니다. 따라서 앞으로 시간이 가면서 정보의 표현 추세는 이러한 독립적 문서들은 XML로 표현이 되며 이를 연결해주는 전체적인 시맨틱웹의 데이터모델은 RDF를 중심으로 구성이 될 듯 싶습니다.

마가린 바르기 bookmarkr.net metags WZD.com 네이버에 북마크 다음에 북마크 HanRSS에 북마크하기 이올린에 북마크하기 Pumfit에 글 올리기 News2.0에 투고하기 del.icio.us에 북마크하기 댓글 RSS 붐바

이 글은 Saturday, July 23rd, 2005 10:25 pm에 semanticWeb, standardization, metadata 범주 하에 작성되었습니다. 이 글에 대한 댓글은 다음 피드를 통해 계속 확인하실 수 있습니다. 여기에서 댓글을 남기실 수 있습니다. Trackback URL: http://twlog.net/wp/wp-trackback.php?p=217.

4 Responses to “[시맨틱웹] 3. 꼭 RDF를 사용해야 하나요? XML 으로도 충분해 보이는데.”

태우님 블로그를 통해 시맨틱웹에 대한 정보를 읽다보니 web2.0의 이해를 도와주는게 아닌가 조심스레 생각이 듭니다.
‘컴퓨터가 웹을 잘 사용하도록’
이해력은 딸리지만 뭔가 느낌이 오는 것 같습니다.
잘못 느끼고 있다면 낭패 OTL

좋은 글을 읽으며 이전에 어떤 분과 논쟁했던 부분이 떠오르네요.

제가 rdf 문서 형식의 rss 는, 보다 간략화된 rss 2.0 의 문법보다 복잡해서 좋지 않다라는 얘길 했었는데요. 그 분은 rdf 는 단순히 rss 에 쓰이기 위해 나온 게 아니며 뭐 여튼 더 복잡한 것이라고 얘길 했었습니다. 저는 그 때 rdf 를 잘 몰랐기에 이해를 못했지만.. 여튼, 제가 생각할 때 본문에 언급된 것처럼 rdf 문법은 좀 복잡합니다. 기계가 잘 이해하기 위해서인지는 몰라도 가독성이 떨어지더군요. 파싱 문법에는 좋을지 몰라도 사람이 읽기에는 별로 였습니다. rss 2.0 소스를 보다가 rdf 로 이루어진 rss 소스를 보니 눈 돌아갔죠. 그 이유 중 하나로, 저는 rdf 가 속성을 많이 사용한다는 것을 꼽습니다. rss 2.0 형식을 보면 속성이 아니라 요소의 값으로 표현합니다. 가령 foo 이런 식으로요. 근데 rdf 는 이런 식이죠. 다 그런 건 아니지만..

xml 이 2000년도 즈음에 국내에 대중에게 알려지면서 조금 바람이 불다가 2002 년 이후에야 비로소 제대로 쓰이게 된 것 같더군요. 거기엔 rss 의 공헌도 큰 것 같습니다. xml 이 가지는 장점에 비해서 별로 유용하게 안 쓰인다는 인상을 받았거든요.

크엑… 여기가 워프라는 것을 잠깐 잊었습니다. 여전하네요.. 태그로 쓴거 경고도 없이 그냥 다 없애버리기..(이래서 워프가 싫습니다)

위 답글의 두 번째 단락의 끝 문장을..

“rss 2.0 형식을 보면 속성이 아니라 요소의 값으로 표현합니다. 가령 <data>foo</data> 이런 식으로요. 근데 rdf 는<data value=’foo’>foo<data>이런 식이죠.”

이렇게 정정합니다. -_-; (그러고보니 워프는 글 수정도 불가능하군요.. 오픈소스인 건 좋은데.. 이런 쪽은 발전이 없네요)

좋은 정보 잘 보고 갑니다

RDF의 상당한 문법이 머리 아프지만 ‘추론’을 이용한 자동화된 웹자원의 이용에 기대를 걸어 볼 수도 있을 것 같습니다.

기계가 의미적으로 이해할 수 있는 자원이라면 it분야가 인공지능쪽으로 한발짝 더 다가갈 수도 있겠구요.

아직은 설왕설래 말들이 많지만 확실한 표준과 지원하는 편리한 툴이 와준다면(protege-2000은 편리하지만은 않더군요)

모델링과 아키텍쳐 분야도 조금씩 점령할 수 있을 것 같구요

Have your say





굵은 글씨로 표기된 값은 꼭 넣어주셔야 합니다. 이메일주소는 절대로 발행되거나 배포되지 않습니다.

일부 HTML 코드는 사용이 가능합니다:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>
URIs must be fully qualified (eg: http://www.domainname.com) and all tags must be properly closed.

Line breaks and paragraphs are automatically converted.

Please keep comments relevant. Off-topic, offensive or inappropriate comments may be edited or removed.