2007년 6월 18일 월요일

런던 매쉬 업 이벤트 참가 리포트, 다음엔 웹 3.0?

David Lenehan and Richard MacManus ( CNET Japan ) 2007/03/13

2007년 2월 22일, 런던에서 열린 매쉬 업 이벤트에 참가했다. 이 이벤트는 「베코시스」(Vecosys)와 「이트라이브즈」(eTribes)가 개최했다. 이날 밤의 화제는 「다음엔 웹 3.0 인가? : 시맨틱 웹의 등장」(What's Next, Web 3.0?: The coming of the semantic web)이었다. 좌담식 공개 토론의 참가자는 「세갈라」(Segala)의 폴 월시(Paul Walsh)와 「X-포트」(X-Port Ltd)의 마크 버벡(Mark Birbeck), 토니 피시(Tony Fish)였고, 이 이벤트의 진행자 역은 세티 샘 (Sethi Sam)이 맡았다.

샘은 우선 시맨틱 웹의 진행이 현재 어디까지 진행되었는지에 대해서와 마이크로 포맷의 등장에 대한 주제로 이야기를 시작했다. 그는 「HCard」나 「HCalender」등의 포맷을 사용하고 있는 몇 개의 사이트를 예로 들었다. 마이크로 포맷에 친숙하지 않은 독자들에겐 「worldcupkickoff.com」라는 사이트를 마이크로 포맷을 사용하고 있는 사이트의 좋은 예로 들 수 있을 것이다. 이 사이트의 캘린더 애플리케이션에는 유저들이 월드컵의 시합 일자를 기록하는 부분에 HCalender 포맷이 사용되고 있다.
현재, 마이크로 포맷은 서드 파티가 제공하는 플러그인을 도입한 브라우저로밖에 알려지지 않았지만, 「파이어폭스 3」(Firefox 3)에서는 기본으로 포함되어 있는 기능이 될 것으로 현재 확실시 되고 있다.

편집자 주: 마이크로 포맷 - 메타데이터의 일종으로 HTML 콘텐츠에 그 내용을 추가적으로 기술하기 위한 포맷, 웹 콘텐츠의 내용을 고려한 데이터베이스화를 진행시키는 목적으로 사용된다. 마이크로 포맷의 표준은 XML(XHTML)의 기술로 구성된다.

X-Port
마크 버벡이 최초로 발언권을 가졌다. 그는 자신의 제품인 X포트와 「사이드와인더」(Sidewinder)를 설명했다. 사이드와인더는 데스크톱 상에서 자바스크립트 등의 웹 기반의 기술을 사용할 수 있도록 하는 플랫폼이다. 웹 애플리케이션을 래핑해서 데스크톱에서 실행할 수 있다. 나는 이 제품의 가치에 대해 잘 모르지만, 그에게 제품에 대한 메리트를 충분히 설명할 수 있는 시간이 주어졌다고는 생각되지 않는다. X포트는 「X폼즈」(XForms)의 프로세서이다. 이 자리에서는 X폼즈에 대한 언급이 없었지만 X폼즈는 개인적으로 관심을 가지고 있는 기술이며 내 자신이 하고 있는 일에도 연관이 있다.

Content Label
다음에 발언권을 가진 사람은 폴 월시였다. 그는 「콘텐트 레이블」(Content Label) 포맷에 대해 열심히 이야기 했다. 그의 아이디어는 이 이벤트에서 많은 논의의 소재거리가 되었다. 콘텐트 레이블은 웹 사이트의 콘텐츠를 설명할 수 있도록 하는 것이다. 콘텐트 레이블은 페이지의 내용을 설명하는 RDF 파일이며 웹 페이지에 링크된다. 이것은 메타데이터이며 낡은 HTML의 메타태그에 매우 가까운 목적으로 사용할 수 있다. 콘텐트 레이블이 메타태그와 다른 것은 사용자가 정보를 인증할 수 있는 것이다.

이 아이디어는, 다음과 같다. 당신은 웹 사이트를 소유하고 있다고 가정하자. 이 사이트는 주로 축구에 대한 내용을 다루며, 성인 콘텐츠는 없고, 아이들이 볼 수 있으며 프랑스어로 구성되었다고 하자. 이 모든 특징들을 설명하는 콘텐트 레이블을 작성해 콘텐트 레이블 관리자에게 전송하면 이것에 대한 인증을 받을 수 있다. 콘텐츠에 대해 제삼자에 의한 권위 부여가 매우 저렴한 요금으로 제공되고, 이 콘텐츠의 레이블이 사이트의 내용과 비교했을 때 정확하다는 것이 보증된다.

이것의 분명한 이점은 만약에 콘텐트 레이블이 널리 보급된다면, 웹의 콘텐츠를 검증 가능한 동시에 일정부분 신뢰할 수 있는 메타데이터를 최초로 사용할 수 있게 되는 것이다. 검색엔진은 이것을 이용한 사이트의 랭킹을 실시할 수 있을 것이고 브라우저는 아이에게는 아이가 열람 가능한 웹 사이트를, 프랑스인에게는 프랑스어를 사용하는 사이트를 표시한다. 나는 이 이벤트 후에 폴과 콘텐트 레이블에 대해 긴 시간동안 이야기 했지만 콘텐트 레이블의 기능이나 사용법에 대한 나의 의견을 제시하는 것을 깜박했다. 현재는 나 스스로 콘텐트 레이블에 대한 개념을 바로잡으려고 노력하는 중이다.

이트라이브즈 매쉬 업 이벤트 -폴 월시
현재 시점에서, 마이크로 포맷은 파이어폭스에 서드파티가 제공하는 「서치 스레셔」(Search Thresher)라는 이름의 플러그인의 형태로만 찾아볼 수 있다. 마이크로 포맷이 장래에 다른 주요 브라우저에 적용될 계획은 없지만 청중들은 이 기술에 대해 많은 관심을 보였다. W3C는 마이크로 포맷을 표준기능으로 적용하겠다고 발표했고 MS는 IE의 플러그인으로 마이크로포맷을 채택하는 것에 흥미를 나타냈다.
청중으로부터 많은 질문들이 쏟아져 나왔다. 많은 사람들이 마이크로 포맷과 콘텐트 레이블이 시맨틱 웹과 아무 관계가 없다고 느끼고 있었던 것 같다. 논점 중에 가장 흥미로웠던 것은, 이러한 기술들은 웹상에서 머신이 콘텐츠를 읽을 수 있게 할 뿐, 시맨틱 웹이 중점을 둔 머신이 콘텐츠를 이해할 수 있게 할 수 없다는 것이었다. 하지만 나의 의견은 좀 다르다. 시맨틱 웹은 아직 초기 단계에다가 발전할 가능성은 거대하고, 일단 머신이 무엇을 읽을 수 있어야 이해를 하지 않겠는가. 라는 생각이다. 이러한 기술은 단지 초석에 지나지 않지만 기술이 발전하는 과정에 있어 매우 중요한 과정이라고 생각한다. 나는 콘텐트 레이블을 좋아하고 내 사이트에도 그것을 적용해보고 싶다.

정리
토니 피시는 마지막으로 이야기를 했다. 내가 아는 한, 그는 시맨틱 웹의 중요성에 이의를 주장했다. 그러나 그의 주장은 조금 희미했으며 그의 논점이 무엇이었는지 이해할 수 없었다.

이 매쉬업 이벤트는 정말로 즐거운 기회였다. 가만히 앉아서 듣기만 하는 청중을 향해 말하는 것이 아니라, 말하는 사람이 청중의 의견에 노출되어 있었기 때문이다. 샘과 마이크는 이 이벤트의 영상이 가까운 시일 내에 유튜브에 업로드 될 것이라고 가르쳐 주었다. 만약에 당신이 런던이나 매쉬업 이벤트가 개최되는 곳 가까이 살고 있다면 꼭 가봐야 할 것이다. 매우 좋은 경험이 될 것이 확실하기 때문이다. @

수개월 내 시맨틱 웹의 엄청난 성장과 마주할 것

조광현 기자 ( ZDNet Korea ) 2007/02/14

13일 서울대 의생명지식공학연구실이 주최한 시맨틱 웹 2.0 컨퍼런스는 시맨틱 웹 2.0이라는 주제를 새롭게 조명하는 자리였다. 이미 수 년 전 알려지면서 크게 관심을 받았던 시맨틱 웹은 첫 관심에 비해 부각되지 않았다고 할 수 있다. 그 동안 이렇다할 프로젝트가 국내에 소개되지도 않았고, 본격적인 움직임도 감지되지 않았기 때문.

이번 컨퍼런스를 위해 방한한 아일랜드 DERI 연구소의 스테판 데커 교수와 서울대 김홍기 교수, 독일 칼스루에 대학 AIFB 연구소의 데니 브란데치크 교수를 만나 시맨틱 웹 2.0에 대한 다양한 정보와 전망을 들어봤다.

스테판 데커 교수는 아일랜드 국립대학의 전임교수로 DERI(Digital Enterprise Research Institute) 연구소의 디렉터이다. 그는 이전에 스탠포드 대학과 칼스루에 대학에서도 연구했고, 시맨틱 웹, 메타데이터, 온톨로지, 반구조 데이터 등 다양한 분야에 관심을 갖고 있다.
데니 브란데치크 교수는 독일 칼스루에 대학의 AIFB(Institute of Applied Informatics and Formal Description Methods) 연구소 연구원이다. 현재 온톨로지 이밸류에이션, 웹 2.0 패러다임과 시맨틱 기술의 조합에 대한 연구를 수행하고 있다.

DERI는 어떤 연구 기관인가?스테판 데커 교수: 2003년 설립되었고, 현재 85명이 시맨틱에 대한 연구를 진행하고 있다. DERI의 연구는 이제 웹에서 애플리케이션 확장 단계로 e러닝, 전자정부 등에서 다양한 분야로 확장하고 있다. 현재 진행되고 있는 애플리케이션 분야에 대한 연구는 성과가 나오는 대로 아일랜드에서 별도의 회사로 분사해 나갈 예정이다.

스테판 데커 교수

이번 컨퍼런스를 주최한 의생명지식공학연구실은 DERI와 어떤 관계이며, 어떤 작업을 진행하고 있나? 김홍기 교수: DERI와 공동개발을 위한 상호 협력 프로그램을 갖기로 하고, 학생 교환 프로그램을 진행하기도 하고, 상호 개발 노력을 함께하고 있다. 의생명지식공학연구실은 e헬스 분야에 관련해서 DERI 연구소와 밀접한 관계를 가져가도록 할 것이다.

김홍기 교수

시맨틱 웹을 정의한다면? 데커: 웹의 하이퍼텍스트만이 아니라 오브젝트 간의 관계에 관한 것이다. 처음 웹을 개발했을 때는 서로 다른 데이터 중심적인 관계를 생각했으나 당시의 리소스로는 이것이 현실적으로 불가능했다. 이제 웹은 하이퍼텍스트 이상을 현실화할 수 있는 기반을 갖게 됐기 때문에 이를 위한 데이터 포맷과 유형이 가능해졌다.
W3C에서 시맨틱 기술의 표준 기반 기술로 XML , RDF 등을 내놓고 있다. 이는 오브젝트간의 관계를 말해주는 것으로 웹 상에서 이를 가능하게 했고, 컴퓨터가 읽을 수 있는 포맷으로 제공한 것이다.
교환 메커니즘이 필요해서 데이터 포맷이 확장 가능하고 관심 가진 모든 정보를 연결해 줄 뿐 아니라 재사용, 시각화가 가능해진다.
시맨틱 웹은 현재의 웹의 확장이다. 기존의 구조를 정의해서 서로 교환 가능하게 하는 것을 말한다. 애플리케이션 측면에서 검색 엔진에서 타깃팅 검색을 필요한 정보에 맞춰서 하게 한다는 것이다.

김홍기: 웹의 기본이 되는 연결성을 시맨틱하게 바꾼다고 설명할 수 있다. 즉 각 단어의 역할을 구조화된 폼으로 만드는 것이라고 할 수 있는데, 의생명지식공학연구실에서 진행하는 프로젝트를 예로 들면 이헬스에서 상호운용을 들 수 있겠다. 즉 병원의 이기종 시스템 상에서 DB 필드가 다르면 상호운용이 안되는데 이를 특정 용어 기반으로 이를 RDF로 바꾸면 상호운용성을 확보하게 되는 것이다.

데니 브란데치크 교수

웹 2.0과 시맨틱 웹의 관계는?데커: 시맨틱 웹은 데이터 교환에 관한 발전된 방향이며, 사양과 표준을 만드는 것이다. 누구와도 HTML 페이지를 교환할 수 있는 것처럼 핵심은 데이터 교환에 있다. 웹 2.0은 사용자 상호경험이다. 프런트 엔드에 관한 것이어서, 데이터의 저장 등에 관심없이 유저의 경험을 향상시킬 수 있는 것이 무엇이냐에 있다.
웹에서는 여러 사이트의 상호 작용에 문제가 생길 수 있다. 데이터 상호 교환이 일어나야 하는데 이를 위한 상세한 정의의 순간에 시맨틱 웹은 2.0을 가능하게 해주는 기술적인 배경이 된다. 그러니까 웹 2.0과 시맨틱 웹은 상호 보완적 개념이다.

김홍기: Web2.0은 어떤 기술이어도 상관없지만 시맨틱 웹은 기술(엔지니어링)이고, 그래서 2.0은 사회과학적 개념이라고 할 수 있다.
웹 2.0으로 모든 사람이 퍼블리싱이 가능해졌다. 데이터도 마찬가지로 야후나 구글의 맵을 가지고 매싱이 가능해졌다. 모든 사람이 데이터를 매싱할 수 있게 하는 것이 시맨틱 웹 기술이다.
시맨틱 웹이 상용화되어 사용되는 사례가 있나? 데커: 이미 소기업을 중심으로 광범위하게 사용되고 있다. 소기업 뿐 아니라 이미 잘 알려진 야후도 백엔드에서 자체적으로 모델을 개발하는 것 보다 이미 개발된 모델에서 시맨틱 웹 기술을 이용해 프로젝트를 수행하고 있다. 스카이프의 비너스 프로젝트에서 도 RDF를 이용하고 있고, IBM 내에서도 RDF를 사용하고 있다.
AJAX처럼 드러나는 것이 아니기 때문에 눈에 띄지 않을 뿐 RDF는 수개월 내로 빠르게 보급이 될 것이다. RSS는 RDF에서 개발된 기술로 이미 수백만 개의 블로그에서 사용되고 있다. 이런 기반은 블로그를 포스팅하는 기술에서 다른 기술로 이행해 갈 것으로 보고 있다.
5년젇도 됐지만 HTML 페이지보다 시맨틱 웹의 페이지 수가 훨씬 많다. 지금의 웹이 너무 방대해서 느끼지 못하는 것일 뿐이다. 웹 상에서 기하급수적인 성장을 느끼는 것도 있고 시맨틱 웹으로 데이터 상호연결, 오브젝트의 상호연결이 가능해졌기 때문이다.
김홍기: 시맨틱웹에 대해 한국에서는 회의적인 인식이 있는데 이유는 한국에서 프로젝트를 했던 것이 모든 것을 검색에서 지능적으로 한다는 환상을 불러 일으킨 부분이 크다. 하지만 기대 수준을 낮추고 가볍고 쉬운 접근이 필요할 것이다.

W3C에서 표준화를 제정한 것은 결국 데이터 포맷을 표준화하고 범용성을 확보하려고 했던 것이지만 현재는 이를 충족하지 못했기 때문에 활용은 제한적이고, 광범위한 웹으로의 활용이 이뤄지지 않은 것은 아닐까? 데커: 많은 데이터들이 DB에서 생성된 것이고, 생성된 페이지에 의한 것이기도 하다. 개방 환경에서 생성된 SIOC(Semantically-Interlinked Online Communities)도 그 중의 하나가 될 것이다.
프리텍스트가 아닌 경우 어떤 형태로든 구조화되어 있다. 순수 HTML이거나 DB의 일부fh 정형화된 콘텐츠를 개방형 환경으로 꺼내서 사용할 수 있다. 문제는 단어의 표준화 부분인데 이것이 장애 요소가 되고 있다. RSS, SIOC에서 확장해나가는 것이 관건이다.
단어의 표준화 부분은 수백명 수천명의 사람들이 각자 개발하고 서로의 관계를 설명하지 못하고 있어 동의를 받지 못하고 있다. 과제는 수개월 내에 이런 부분을 해결하는 것이다.
데니 브란데치크 교수가 참여하고 있다는 시맨틱 미디어 위키는 무엇인가? 데니 브란데치크 교수: 미디어 위키의 확장 시스템으로 미디어 위키의 지식을 손쉽게 공식화 하는 타입 투 링크와 속성을 손쉽게 제공하도록 하는 것이다. 시맨틱 미디어 위키는 위키 머신내에 있는 정보를 이해 가능하도록 하는 것으로 백과사전을 기계에서 사용할 수 있도록 하는 작업이라고 할 수 있다.

비스타의 마이크로 포맷과 시맨틱 웹의 관계는? 데커: 마이크로 포맷은 시맨틱 웹과 매우 밀접한 관련이 있다. 마이크로포맷과 RDF를 통합하자는 말이 있을 정도다. 마이크로포맷은 링크, 접속이 RDF보다 조금 떨어진다. 마이크로포맷을 적용하면 사람들간에 상호 연결을 잘 사용할 수 있다. 비스타에서 마이크로포맷이 지원되는 것은 웹, 데스크톱의 경계를 허무는데 큰 도움이 될 것이다.
비스타 이외에는 RDF가 닷넷 프레임워크에서 지원된다. 비스타에서 어떻게 시맨틱 웹이 전개될지는 지켜봐야 하는데 MS에서 시맨틱 데스크톱으로 더 가야했다고 본다. 정보관리의 문제를 MS에서 지원할 수 있는 메타데이터 아이템이 더 있는데 안하고 있다.@

시맨틱 웹, 2.0으로 거듭나라!

윤석찬 (다음 R&D 센터 팀장) 2006/05/16

얼마 전 우리 나라 블로거들 사이에 국내 시맨틱 웹 연구의 현황에 대한 논쟁이 있었다. 이 논쟁은 ETRI의 전종홍 선임연구원은 최근 인공지능(AI)이나 자연어 처리(NLP) 같은 시맨틱 기술 중심으로만 관심을 가진 연구자들이 “시맨틱 웹(Semantic Web)”이라는 이름을 빌어 연구를 계속 하면서도 정작 산업적으로 중요한 “웹”이 빠져 있는 국내 연구 실정을 개탄 하면서부터 시작되었다.

…처음에는 늘 시맨틱 웹이라는 이름으로 시작하는 논리가 마지막에 가서는 "웹"은 어디론가 스리슬적 사라지고, 거창하고 복잡한 온톨로지와 추론에 대한 이야기, 그리고 지능 정보 처리에 대한 이야기들만 남는 식이죠… 도대체 "시맨틱 웹"으로 시작한 이야기의 결론에서 우리의 "웹"은 어디에 있습니까? 온톨로지만으로 웹을 위해 무엇을 할 수 있습니까?
(출처: HolloBlog ‘온톨로지 유감’ 중에서)

전 연구원은 유명 블로거이자 웹 표준 연구자로 필자와 국내 웹 초창기 때부터 인트라넷, 지식 기반(KB) 연구를 지속해 왔으며, ETRI 내에 W3C 한국 사무국을 유치하는데 일조 했을 뿐 아니라 2002년부터 국내에 시맨틱 웹을 소개하고 관련 연구를 지속해 왔다. 그런 사람이 마치 국내 시맨틱 웹 연구 자체를 부정하는 듯한 이야기를 하는 것이 이상하게 여겨질 수 있다.
시맨틱 웹의 현재그런데 전 연구원이 말하는 국내 문제를 이해하기 위해서는 해외의 시맨틱 웹 표준 연구 속의 현실도 알 필요가 있다. 1992년 웹을 처음 만들었던 팀 버너스 리는 하이퍼텍스트(HTML)와 HTTP라는 아주 간단한 기술 사양 만으로 정보를 연결하고 기술할 수 있다는 점에서 매우 성공을 거두었다. 그는 나아가 인간뿐만 아니라 기계도 이해할 수 있는 상호 호환성을 위한 시맨틱 웹을 제창 했다. 이것은 정보의 접근 자체에 대한 제악이 없어야 한다는 비전에 근거한다.
이러한 목표를 통해 나온 각종 웹 표준이 XML, Web Services, RDF, OWL, 온톨로지(Ontology), 추론 엔진 등등이다. 그런데, 온톨로지니 추론이니 하는 말 자체 어감에서 풍기듯 시맨틱 웹의 실제 정의는 기계들간의 소통 수단을 위해 인간이 개입할 여지가 없는 매우 복잡한 기술 사양으로 가고 있는 것이 사실이다(독자들은 지금 이러한 용어들을 이해할 필요가 없다.). 이것은 팀 버너스리가 과거 인공 지능을 연구했던 사람들을 W3C에 끌어 들이면서 필연적으로 생겨난 현상이다. 기계가 읽을 수 있는(Machine-readable) 웹이라는 것이 결국은 인공 지능, 기계 학습 등과 같은 방향으로 갈 수 밖에 없기 때문이다.
시맨틱 웹 이야기가 나온 지 7년이 지났지만 표준 사양 외에 무슨 산업적 공헌을 했는지 이야기하라고 하면 할말이 없다. 시맨틱 웹 연구와 기술이 미완성이라 부족하다 하고 현업 엔지니어들은 어떻게 써야 할지 모르겠다고 하는 것이 현재 상태다. 이런 이유로 W3C는 작년부터 RDF 중심의 접근 방식으로 변경을 시도하면서, 시맨틱 웹을 잘 사용하는 사례들을 수집하고 다양한 의료/생명과학 분야 등과 같은 고유한 응용 분야를 찾기 위한 노력들을 거듭하고 있다.
인간 중심(Human-readable) 시맨틱 웹이런 지루한 기계 중심 시맨틱 웹 연구가 계속 되는 동안 소위 말하는 “문서 중심 혹은 인간 중심 웹”은 매우 비약적인 성공을 거두었다. 많은 사람들이 HTML을 이용하여 웹에 정보를 기술하고 이를 상호간 이용하게 되었다는 것이다. 브라우저 전쟁이라는 암흑시대도 있었지만, 오히려 그 후 웹 표준이 활성화 되고 좀 더 구조적인 문서를 만들어 내려는 웹 표준 홍보 활동도 강해졌다. 그 와중에 웹2.0이라는 트렌드가 이슈화 되었다. 필자는 한 컨퍼런스에서 시맨틱 웹이 바로 웹2.0의 기술적 배경이라고 언급한 바 있다. 그러나 그것은 기계 중심이 아니라 바로 인간 중심(Human-readable) 시맨틱 웹이다.
최근 전 세계적인 유행이 된 블로그 서비스의 가장 큰 특징을 꼽으라고 한다면, RSS(Really Simple Syndication)라는 콘텐츠 소통 방식을 사용한다는 것이다. RSS는 과거 넷스케이프의 CDF 또는 포인트 캐스트의 채널과 유사하지만, 컴퓨터 소프트웨어의 일방향성에만 의존한 결과 실패했다면 RSS는 네트워크에 분산된 사람들의 콘텐츠를 소통시켜 주는 이해하기 쉬운 아주 간단한(Really Simple) 사양이었기 때문에 성공했다. RSS는 정보 제공자를 기술하고 항목을 나누어 제공해 주는 읽어 보면 무엇을 제공하는지 사람도 이해할 수 있는 간단한 표준이다. 즉, RSS는 시맨틱 웹의 대표 사양인 정보 표현 프레임웍(RDF)의 2차 산물이다.
시맨틱 웹의 사례를 찾고자 노력했던 W3C 입장에서는 그렇게 간단한 사양이 인기를 끌지는 생각도 못했을 것이다. 시맨틱 웹뿐 아니라, 웹서비스(Web Services)도 마찬 가지이다. 구글, 아마존, 이베이 등은 축적한 사용자 데이터를 근간으로 이를 Open API라는 데이터 유통 구조를 만들어 내고 서비스를 플랫폼화 하는 노력을 견지해 왔다. 이 때 사용했던 기술이 바로 사람들이 쉽게 이해할 수 있는 간단한 XML 사양과 HTTP를 이용한 웹 서비스의 구현이다. XML-RPC, REST+XML, SOAP 등의 메커니즘으로 제공되는 웹 서비스 환경에서 REST+XML 방식이 주로 사용되고, SOAP은 전체 통신량 중에 5%도 채 되지 않았다. 이들은 모두 인간과 기계 모두가 소통 가능한 시맨틱 웹을 아주 잘 응용한 기술들이다. 현재 웹2.0의 주요 키워드 중 하나인 태깅(Tagging)이나 콘텐츠를 기계가 이해하도록 사람이 작성하는 마이크로포맷(Microformat.org) 같은 것도 사람 중심 시맨틱 웹의 예다.
웹2.0의 성공이 주는 교훈은 인간이 이해하기 어렵고, 전문가 중심의 고도로 복잡한(?) 시맨틱 웹 기술들이 정말 상용화 될 수 있을 것인가 하는 것이다. 왜냐하면, 웹은 필연적으로 사람이 관련되어 있고 사람과 기계가 동시에 읽을 수 있는 기술이어야만 네트워크 효과를 얻어 낼 수 있음이 증명 된 것이기 때문이다. 물론 그러한 시맨틱 웹 기술들이 소프트웨어 산업에 긴요하게 쓰일 수 있을 지는 몰라도 웹이라는 세상에서 쓰이기에는 한계가 분명히 있다. 간단하고 이해하기 쉬운 사양이야 말로 웹에서는 선(善)이다.
기술 발전은 과거에 대한 반성에서 출발해야2004년 4월 W3C는 웹에서 좀 더 확장된 애플리케이션을 만들기 위한 의견을 청취하는 워크샵을 열었다. 이 워크샵의 쟁점은 오페라/모질라 재단 연합이 발표한 웹 애플리케이션 방향에 대한 것이었다. 이들은 HTML과 DOM 등 기존 웹 표준 기술을 활용한 중간 단계의 웹 애플리케이션 표준을 빨리 만들자고 제안했다. 이에 대해 많은 참석자들은 부정적인 반응을 나타냈다. 이런 문제를 다룰 워킹 그룹이 아직 존재하지 않는다는 이유를 달았지만, 이미 W3C는 기존 XML을 기반으로 하는 상호 연동에 더 관심이 많았다.
결국 문제는 엉뚱한 곳에서 터지고 말았다. 그 해, 구글로 부터 시작된 Ajax라고 불리는 웹 애플리케이션 기법이 힘을 얻기 시작한 것이다. Ajax가 웹 서비스 업계로부터 힘을 얻기 시작하자, W3C는 작년에 Rich Web Client Activity를 만들고 2006년 4월 XMLHTTPRequest에 대한 첫 표준 초안을 만들 수 밖에 없게 되었다.
필자는 표준 무용론을 이야기하려는 것은 아니다. 혁신을 위해서는 과거에 대한 반성을 통해 변화해야 한다는 것이다. HTML이나 XML은 SGML의 반성에서 출발했고, RSS는 CDF의 반성에서 출발했다. 언젠가 기계 중심의 시맨틱 웹이 활성화 될 날이 올지도 모르겠지만 기술은 계속적인 자기 부정을 통해 발전할 수 밖에 없다. 기술적 난이도와 완성도도 중요하지만 더욱 중요한 것은 얼마나 많은 사람이 어떻게 어디에 쓸 수 있는 가이다. 복잡한 수만 개의 온톨로지와 추론 엔진들보다 RSS라는 작은 포맷 하나가 더 큰 경제적/산업적 효과들을 가져올 수 있기 때문이다.
지금까지 이야기한 사례들은 국제적인 W3C 활동과 국내 시맨틱 웹 연구자들에게 시사해 주는 바가 크다고 하겠다. 시맨틱 웹 연구자들이 웹이 아닌 시맨틱에만 관심을 기울이면 결국 현실과 괴리될 수 밖에 없다. 시맨틱 웹은 웹을 위한 기술이어야 하며, 웹은 지극히 인간적이고 때문이다. 과거에 대한 반성을 기초로 연구자들이나 산업계 종사자들이 인간 중심의 시맨틱 웹을 그리는 노력을 지속적으로 할 때, 연구를 위한 연구에 매몰 되지 않을 것이다.@

이 블로그 검색

팔로어

블로그 보관함