많은 사람들이 정보에 대한 분류 체계로 트리 구조를 떠올린다. 트리 구조란 최상위 노드를 제외한 노드가 상위 노드를 하나만 갖고 하위 노드를 여러개 가질 수 있는 구조를 말한다. 탐색기를 띄워 C 드라이브의 폴더 구조를 보라. 이것이 트리 구조이다.

트리 구조에 의한 분류 체계는 굉장히 오래전에 소개되었고 많은 사람들이 아직도 널리 사용하고 있다. 굳이 하드 디스크의 폴더 구조가 아니더라도 책이나 음악의 장르, 기업의 인사 체계 등 다양한 곳에서 적용되는 걸 보면 이해하기 쉬울 것이다. 특히 컴퓨터가 급속도로 보급되던 시절, DOS나 UNIX 같은 운영체제들이 하드 디스크의 파일들을 구조화하기 위해 트리 구조를 채용하고 그것을 지금까지 이어감으로써 컴퓨터에 익숙한 많은 사용자들은 이제 정보를 구조화하는 방법으로 트리 구조만을 떠올릴 정도로 습관화 되어있다.

그러나 다루어야하는 정보의 양이 급속도로 방대해지자 사람들은 트리 구조만으로는 불편함을 느끼기 시작했다. 5년전만해도 야후의 카테고리는 꽤 쓸만했다. 필요한 정보가 어느 범주에 속하는지 판단하고 적절한 카테고리를 찾아 내려가다보면 금방 원하는 정보를 찾을 수 있었다. 그러나 5년 사이에 정보는 기하급수적으로 방대해져버렸고 카테고리 역시 무수히 가지가 뻗어서 원하는 정보를 찾기위해 카테고리를 찾아 내려가는 과정이 매우 복잡해져버렸다. 따라서 이제는 많은 사람들이 야후의 카테고리를 통해 원하는 정보를 찾기 보다는 구글에 검색어를 입력하는 방법을 선호한다.

트리 구조는 가지가 뻗어 나감으로써 분류 체계가 n승으로 복잡해진다는 단점이 있다. 처음엔 하나였던 노드가 2개의 가지를 치고 새로운 노드들이 다시 2개의 가지를 친다면 1+2+4=7개의 노드가 생겨난다. 이러한 과정이 반복되면 분류 체계가 압도적으로 복잡해져서 검색을 오히려 불편하게 한다.
 
또 다른 단점은 정보를 특정 노드(카테고리)로 분류하기 힘든 경우가 많다는 것이다. 정보를 등록하기 위해 두 개 이상의 카테고리에서 고민하던 경험이 누구나 한번쯤은 있을 것이다. 컴퓨터의 운영체제는 이러한 문제를 해결하기 위해 바로가기나 심볼릭 링크 등을 제공하였지만 이것은 일종의 꼼수일 뿐 큰 효과를 발휘한다고 볼 수 없다.

태그(Tag)는 이러한 상황에서 최근에 각광을 받기 시작한 분류 체계의 한 방법이다. 태그는 특정 정보에 대해 그것을 요약해서 잘 나타낼 수 있는 일종의 키워드를 말하며 태그를 입력하는 행위를 태깅이라고 한다. 따라서 태그는 메타 정보이다. 메타 정보란 특정 정보에 대한 정보를 말한다. 이해를 돕기 위해 예를 들자면, MP3 파일을 재생하면 노래 제목, 가수, 앨범 제목 등이 나타나는데 바로 이것이 메타 정보이다. 디카로 찍은 사진 파일을 열면 노출, 셔터스피트 등이 나타나는데 이것 역시 메타 정보이다.

메타 정보는 분류 체계와는 다르다. 따라서 태그 역시 그것만으로 분류 체계가 되기 보다는 기존의 분류 체계와 함께 사용되어 기존의 분류 체계가 안고있는 단점을 보완하는 역할을 한다. 태그가 트리 구조와 함께 쓰이면 무분별한 카테고리의 확장을 방지할 수 있고, 둘 이상의 카테고리에 대한 고민을 태깅을 통해 해결할 수 있다. 또한 특정 카테고리가 아닌 특정 주제에 대한 검색을 제공할 수 있다. 근본적으로 태깅은 정보에 대한 요약 정보를 제공하기 때문에 정보를 보다 구조적으로 관리하고 사용할 수 있게 한다.

이러한 장점으로 인해 최근 검색 사이트를 포함해 여러 곳에서 태그를 이용하는 모습을 볼 수 있다. 지금 내가 사용하고 있는 블로그 또한 그러하다. 트리 구조의 분류 체계를 기본적으로 사용하고 있지만 태그로도 검색이 가능하기 때문에 사용자는 특정 주제로 포스트를 검색할 수 있다. 또한 포스트에 대해 태그만 보더라도 이 포스트가 무엇을 말하고자하는지 예측할 수 있으므로 요약된 포스트만으로도 빠르고 쉽게 원하는 포스트를 검색할 수 있다. (내 블로그 상단의 돋보기 아이콘을 통해 포스트를 검색하면 요약된 포스트 목록이 나타난다)

그러나 태그가 만능은 아니다. 태그가 최근 들어서 각광을 받고는 있지만 아직 그것을 어떻게 사용해야 좋은지 마땅한 가이드라인이 없다. 특정 정보에 대해 태그 갯수의 제한이 없기 때문에 자칫하면 무분별한 카테고리의 증식보다도 더 무서운 결과를 초래할 수도 있다. 또한 태그에 사용되는 키워드에 대해서도 제한이 없기 때문에 비슷한 태그의 증식도 막을 방법이 없다. 예를 들어 { "영화감상문", "영화 감상문", "감상문-영화", "Movie"... } 처럼 같은 의미를 갖지만 표현 방법이 다른 태그들의 증식은 오히려 분류 체계를 혼란으로 빠뜨릴 수 있다.

누군가 웹은 커다란 DB(Database)와도 같다고 말했다. 최근들어 그동안 정신없이 산재된 정보들을 구조화하여 쓸모있는 DB로 만들어가자는 목소리가 커지고 있다. 웹이 쓸모 있는 DB가 되기 위해서는 정보를 구조화하는 스키마 작업이 요구되며 이것을 해결하기위해 웹의 구조화, 표현의 표준화, 메타 정보의 삽입 등 다양한 시도들이 이루어지고 있다. 이것이 Web 2.0이며 태그는 이러한 시기에 등장한 여러가지 시도들 가운데 하나라고 볼 수 있다. 그러나 그것을 적절한 가이드라인 없이 무분별하게 사용한다면 오히려 웹을 어지럽히는 존재로 전락할지도 모른다. 태그는 그 자율성 때문에 태깅의 책임은 결국 태깅을 한 본인에게 있다. 그렇기 때문에 태깅을 하는 본인 스스로 태그를 올바르게 이해하고 사용해야 할 것이다.

이 글의 트랙백 주소는 http://semix2.tistory.com/trackback/268 입니다
  1. Mr.M 2007/01/14 21:35 댓글주소 수정/삭제 댓글쓰기

    지금은 분류의 또 다른 확장형태나 구분으로... 또는 이중 분류기능등 원래 기능에 맞춰 비슷하게 사용하다고 생각하지만, 처음에 멋 모르고 태그 적용했다가 나중에 통일 시키느라 삽질 했던것이 기억나네요..^^;

    1. semix2 2007/01/14 23:39 댓글주소 수정/삭제

      사실 저는 지금도 어떻게 사용하는게 좋은지 잘 모르겠습니다. 저 역시 태그를 수정하느라 삽질한 경험이 있어요. ^^;; 하루 시간내서 죄다 고쳐놨는데 고친게 마음에 들지 않아서 갈팡질팡 했답니다. 결국 다시 고치지 못하고 그냥 두었어요. 앞으로는 좀 더 생각하고 신중하게 태깅을 하려고 노력.... 중 입니다;

  2. 용희 2007/01/15 00:08 댓글주소 수정/삭제 댓글쓰기

    요세보면 태그에 중요한 키워드 몇개로 구분하는 것이 아니라 줄줄이 몇개씩 심하면 8,9개 까지 큰 의미없는 것까지도 등록된 포스트를 가끔 보면..
    태그의 의미가 무엇인지 모르는것 같아 안타까운 마음이 들어요..

    1. semix2 2007/01/15 01:19 댓글주소 수정/삭제

      네, 저도 그런 포스트를 봤습니다. 심지어는 { 영화, movie } 이렇게 다국어 번역까지 하는 모습도 보입니다. 저는 이렇게 사용하는 것은 분명 아니라고 생각합니다. 그런 블로그에서 태그 구름을 보면 난감하더라구요. 이런 상황에서는 태그가 웹에 있어 악이 되지 않을까 걱정입니다.

      태그를 잘 활용하는 블로그는 태그 구름만 봐도 이 블로그가 어떤 색깔을 띄고 있는지 파악할 수 있다고 생각합니다. 그런 의미에서 제 블로그는 아직도 98% 부족하구요..
      T-T

  3. 비제이 2007/01/15 17:54 댓글주소 수정/삭제 댓글쓰기

    태그 삽질에 대한 아픔(?)은 공통적으로 갖고 계시네요. ^^

    요즈음 태깅을 하면서 전에 입력했던 태그를 재사용하고자 하나 쉽지 않더군요. 키워드라고 생각하고 태깅을 하는 편입니다. 태그가 갖는 여러 장점도 있지만, 클라우드로 확장될 경우 제어불능에 빠지게 되어, 이를 다시 한정적으로 쓸려고 하니, 다시 (태그) 카테고리로 제한하는 경우로 돌아오네요.
    태그는 메비우스의 띠인가요? ㅡ.ㅡa;;; orz

    태그가 정말로 편리한가?.... 하는 생각을 한 적이 있었는데, 아직도 모르겠더라구요. 태그는 붙이지만, 정작 글을 찾으려면 구글검색을 이용하는 편이네요. 글을 쓸 경우에 주제단어에 대한 묶음 링크를 할 경우에 편리하더군요. ㅡ.ㅡ

    글을 쓰는 사람이 방향성(주제)이 없다는 것이 문제가 아닌가 자아비판합니다. 그러다보니 이~~~따만한 태그 구름만 만드는...쩝.

    댓글을 읽다가 r가슴이 뜨끔하는 경우는 모죠? ㅡ.ㅡa;;;

    1. semix2 2007/01/15 18:28 댓글주소 수정/삭제

      태그 삽질은 저만 하는 게 아니었군요. 윗 분도 태그 삽질의 경험이 있으시다는데 비제이님까지 그런 경험이...;;; 태그, 정말 알다가도 모르겠습니다. 처음엔 태그 구름이 어떤 특색이 보이는가 싶더니 이제는 그냥 알 수 없는 단어들의 무작위 나열같은 느낌이 나요.

      태그가 정말 편리한지는 좀 더 지켜봐야 할 것 같습니다. 어떻게 써야하고 어떤 점에서 유리한지가 명확히 결정되기 이전에 막연히 좋아! 라는 심정으로 쓰는 사람들이 대부분일테니까요. 아마도 태그라는 것이 나온데에는 분명 이유가 있을테니 (제 생각은 포스트 내용과 같습니다만 맞는지는 몰라요 ^^;) 분명 나아지지 않을까 기대합니다.

      아직은 태그의 위험성을 경계하기보다는 그것의 장점을 끌어내려는 시도들이 여기저기서 많이 일어나는 것 같아요.

      글을 쓸 땐 뜨끔한지 몰랐는데 비제이님이 뜨끔하시니까 저도 뜨끔거립니다;;

  4. Pod 2007/01/15 22:28 댓글주소 수정/삭제 댓글쓰기

    좋은 글 잘 읽었습니다. :-) 전 막연히 태그가 카테고리보다 더 편한 분류방법이라고만 생각하고 쓰고 있어요. 그리고 semix2님이 말씀하신 영화, movie 태그를 같이 쓰는 사람이기도 합니다. 사실 그건 쓰면서도 좀 찜찜하긴 했는데. 그런 상황에서는 두 태그중에 꼭 양자택일을 해야만하는건가요?

    1. semix2 2007/01/15 23:49 댓글주소 수정/삭제

      저는 영화, movie 태그를 함께 쓰는 것에 대해 반대합니다. ^^ 영화와 movie가 같은 태그임을 인식하는 기술이 검색 엔진 쪽에서 분명 개발될거라 생각하거든요. 이것과 관련해서 시멘틱웹이라던가 온톨로지라는 분야가 한창 연구 중입니다. 정확히 이 문제 때문은 아닙니다만, 이러한 문제를 해결해줄거라 생각합니다.

      http://semix2.cafe24.com/245 에도 적어놨지만 온톨로지란 컴퓨터가 무엇인가를 이해할 수 있도록 명시적으로 명세하는 것을 말합니다. [영화 is-same-as movie] 라는 지식을 컴퓨터가 이해함으로써 태그 사용자는 두 태그 사이에서 어떤 것이든 하나만 선택하면 되는 것이죠.

      물론 이 기술이 언제 널리 퍼질지, 검색 엔진 등에 이러한 기술이 적용될지는 모르겠습니다만 이러한 문제는 어떠한 방법으로든 해결하려는 노력이 분명 있을거란 생각을 합니다. ^^