NOTICE 
전체 에 해당하는 글 : 37 개
2007.08.25 :: 블로그와 검색 (6)
2007.05.30 :: 졸업 (3)
2007.05.16 :: WWW 2007 Conference (3)
2007.05.14 :: Happy Mother's Day! (4)
2007.03.18 :: "웹검색"의 변화 (5)
최근에 이걸 발표한걸 아시는분은 많지 않으실듯하지만 Yahoo!가 크롤러를 바꿨습니다.
많은 분들이 Yahoo! 크롤러가 너무 들이댄다고 불만이 많으셨는데요^^
어떻게 이제 좀 줄어든 느낌이 나시나요?
한국문서에는 더 좋아진 크롤러인데요, 작지만 하나하나 계속 향상되는 야후검색.
이걸 만드는 기쁨이 큽니다 :)

  
트랙백 1  |  댓글   |
jmirror님이 블로그 검색에관한 블로거 간담회를 여신다고 하는군요.
저도 가봤으면하고 둘러 보다가 그만님의 트랙백을 보게 되었습니다.
그만님의 "말하기 싫게 만드는 말 10"의 도용 사례와 각 검색엔진들의 결과를 예로 들어 주시고 "국산"과 "외산"으로 구분하여 주셨는데요...

같은 말일지 모르겠지만 제 생각에는 그만님의 도용건은 "기술"의 문제가 아니라 "정책"의 문제일듯 합니다.
블로그 검색은 저희 선수(?)들이 말하는 vertical 검색이라기 보다는 web검색에 가까운 특징을 가지고 있습니다. 활발한 링크와 문서간의 anchor text를 통한 교류가 아주 활성화된 분야 입니다. 그만님같은 탑블로거의 경우 이미 pagerank라고 하는(야후는 다른말을 쓰지만^^) 웹링크 분석의 값이 상당히 높아 아주 초보적인 수준의 링크 계산으로도 검색결과에서 위의 블로그가 탑으로 나올수 있습니다.
문제는 이 링크 계산을 다른 포털들이 안쓰거나 "정책"상으로 무시하는것이겠지요.

하지만 반대의 경우는 "기술"적으로 상당히 어려울수 있습니다. 가령 jmirror님이나 그만님이 일반블로거의 글을 도용하셨을경우 링크 계산만으로는 누가 원저자인지 알기가 상당히 힘들겠지요. jmirror님이 한번 테스트 해보시지요 ^^ 아마 Y,G,M에서는 탑으로 나온다는거에 500원 걸겠습니다 :) 뭐 이경우야 학력위조사건처럼 나중에 큰일 나는걸 아실테니 안하실듯 하구요 ^^

그러면 위의 경우는 어떻게 해결할까요?
단순히 글쓴시간만으로는 힘든것이 시간대를 블로거가 조작할수도 있고 크롤된 시간만으로는 아주 부정확하구요.
CCL은 어떨까요?
하지만 제가 쓰는 tistory나 태터의 경우 CCL이 마치 자동으로 선택만 해놓으면 모든 글에 붙게 됩니다. 펌글이든 원글이던 간에요. 그래서 CCL의 원래 의미를 찾기가 상당히 힘들게 되어 버렸는데요.
그러면 비영리 저작권 사이트를 만들어서 등록을 시킬까요? :)
mycopyrights.org
이건 뭐 업계와 블로거 모두가 참여해야 하는것이니 쉬운일은 아니겠네요.

야후코리아는 빨리  비슷한 블로그를 열람할수 있는 기능을 만들어 주세요^^
누가 원저자인지는 확인 못해도 비슷한글들이 어디어디에 퍼져 있는지만 알아도 많은 도움이 되겠어요. 

재미난 토론, 생산적인 토론 하시고 결과는 블로그로 또 널리 알려 주세요 ^^

  
트랙백 0  |  댓글   |

오늘 어떤 분의 장례식 초대장을 받았습니다.
고인이 돌아가시기전에 작성하신 글인듯 했는데 마음에 계속 남는군요.
(아니면 어떤 분의 시인지도 모르겠습니다만...)

저도 이런글을 남길수 있는 마음의 여유를 배워야 겠습니다.

To my Friends, Those I Loved

When I am gone, release me, let me go.
Be thankful for the good times.
I would have loved to have known you longer
To understand, work with you, and play.

You gave me your friendship and I gave you mine,
You may never know how much happiness I received at the time.

So grieve for me a while, if you must
Then be comfirted by trust
You will feel my love
I will always be in your heart

Remember the good times.

조카의 졸업식에 다녀 왔습니다.
아빠 엄마가 사정으로 참석 못하는 바람에 제가 영광을 차지 했습니다.

이제 세상으로 나가는 예쁜아이들,
녀석들의 우정이 계속 이어지길 기원합니다.

사용자 삽입 이미지

이 학교는 졸업식후에 학교 호수에 뛰어드는게 전통이더군요.

사용자 삽입 이미지
  
트랙백 0  |  댓글   |

이미 아시는분들이 많겠지만 혹 모르시는분들을 위해 알려 드립니다.
지난주에 Canada Banff에서 WWW 2007 conference가 열렸습니다.
거기서 발표되었던 페이퍼들이 모두 접근이 가능하군요.
Proceedings: http://www2007.org/proceedings.html
Workshop: http://www2007.org/prog-Workshops.php

당분간 읽을꺼리가 있어서 즐겁겠습니다 ^^

우선 제 눈길을 끄는 몇가지 논문들은 아래와 같습니다.
(읽어 보고 포스팅할만한건 하나씩 따로 써보도록 하겠습니다. 미루기 작전 ^^;;)

Fact Search:
Organizing and Searching the World Wide Web of Facts — Step Two: Harnessing the Wisdom of the Crowds
하니가모님 스폐셜 ^^;;
이거 저자 이메일이 mars@google.com 이군요.
수신제가님이 언제 구글로 가셨나?

블로그 sentiment(positive,negative, neutural):
Topic Sentiment Mixture: Modeling Facets and Opinions in Weblogs
이건 여러회사에서 시도했었고 아마 지금도 어느팀은 하고 있겠죠 ^^;;
제 블로그에 가끔 오시는 어느분도 이 비슷한걸 하셨던걸로 압니다만 ^^.
틀린점은 이것보다 조금더 발전된걸 하셨던 기억이...
논문 내세요~~~

블로그 이슈:
BlogScope: Spatio-temporal Analysis of the Blogosphere  
블로그의 특성상 "burst"되는 이슈들이나 쿼리들에 대한 알고리듬입니다.
요즘 블로그 검색들이 많이들 관심있어하는 분야 인듯 합니다.

라이프 로그:
Life is Sharable: Mechanisms to Support and Sustain Blogging Life Experience  
올라로그가 많이 생각나는 논문입니다.
올라로그 서두르셔야 겠어요 ^^
RFID나 카메라폰등 지금 있는기기들을 이용한 라이프 로깅.

블로그 분류:
Exploring in the Weblog Space by Detecting Informative and Affective Articles
블로그를 일상기록적인것과 뉴스나 테크놀로지에대한 정보,의견의 두가지로 나누어서 보는 입장입니다.

블로그 스팸 처리:
Splog Detection Using Self-similarity Analysis on Blog Temporal Dynamics
일반블로그글들이 퍼블리쉬되는 시간과 제목 링크가 아주 다양한 반면에 스팸이 올라오는 시간과 제목 링크가 어떤 패턴이 있다는 면에서 쓴듯합니다.


일단 이것들을 다읽고 다른 논문에 눈을 돌려 보도록 할 생각입니다 ^^

오늘은 어머니의 날이었습니다.
이곳은 어머니의 날과 어버지의 날을 따로 나누어서 보냅니다.
거의 모든 레스토랑은 오늘은 예약이 힘들정도로 외식하는날이기도 합니다.
보통 간 큰남자 아니고서는 오늘은 아이보기, 음식하기 이런걸 여자에게 시키는 일은 없습니다.

저는 오늘은 너무 붐빌듯해서 어제 아침을 임신한 아내와 아이를 데리고 오랜만의 맛있는 아침을 하고 왔습니다.
저녁은 너무 비싼곳이라 아침으로 대신...^^;;

바닷바람이 너무 좋은 halfmoon bay입니다.


사용자 삽입 이미지

사용자 삽입 이미지
지난 금요일 UC Berkeley에서 있었던 "The Future of Search" 모임에 다녀 왔습니다.

Academia와 industry가 한자리에 모여서 하루를 같이 보내는것만으로도 참 좋은 기회였던것 같습니다. 아무래도 학계와 업계는 밀접한듯 하면서도 또 많이 떨어져 있거든요.
학계에서는 키워놓은 학생들 가져가는데만 업계가 관심이 있는게 아닌가 우려 하기도 하구요^^

제일 먼저 눈에 띄는것은 연령층이었습니다. 지금껏 가본 이런 search에 관련된 세미나 가운데 제일 나이층이 높더군요 50 밑은 한참 어려 보였습니다. 한 50은 넘어야  낄수 있구요. 60넘어 뵈는 분들도 상당히 많이 계셧습니다. 제 앞에 않이 계셨던 노 교수님이 맥북에 Ubantu를 깔아서 eclipse로 무슨 program을 계속 짜면서 실행 시키시던게 아주 신선한 충격이었습니다.

발표자 보기...

올초 한국에서 있었던 "Social Search Brunch" 처럼 이번 모임도 search가 어디로 갈지를 같이 한번 이야기 해보는 자리였는데요, 조금 달랐던건 학계와 업계가 같이 모일수 있었던것 같습니다.
그럼 Future를 뭐라고 다들 생각했을까요?

The Future of Search Agenda 보기...

아마 이 모임을 주최한 CITRIS측에서는 아래 세가지에 검색의 미래가 있다고 생각한듯 합니다. 크게 세가지 큰 panel session이 있었는데요,

  • NLP(자연언어 처리)
  • Communities and Search
  • Multi-Media

학계측에서는 검색을 "Question & Answer"로 많이 접근들을 하셨습니다.
Oren Etzioni 교수는 TextRunner 라는 것을 통해 "Fact search"를 보여 주셨구요,( 이대목에서 하니가모님이 많이 생각 나던데 ^^) 이어서 나온 Lotfi A. Zadeh 노교수님은 그런 "Fact search"식의 probablistic approach나 fuzzy logic의 한계를 정의 해주셨구요 아주 독특한 방식으로(직설화법 ^^) 그런 접근은 실패 할수 밖에 없다고 말씀하셨습니다. 아쉬웠던것은 한계를 보여 주신것은 좋았는데 대안은  말씀안하시고 들어 가셔서 대략 난감...

그리고 이 위의 fact search같은 비슷한 이야기들이 나왔구요.
기억에 남는 한 phrase는 "find! not search"라는... ^^

구글의 Peter Norvig 아저씨는 future를 "artificial intelligence"에서 찾으셨구요 (이 아자씨 background가 그쪽이다 보니 ^^) 야후는 음... 다음 기회에 한번 길게 쓸꼐요 ^^.

학계쪽은 아무래도 구글의 AI를 좋아 하시나 봅니다. 진행자가 이런 농담을 하시더군요.
"So, google found future from artificial intelligence and Yahoo found future from human's stupidity!"

노 코멘트 할랍니다 저는 :)

지난번 한국 출장에서 느낀것중에 하나가 "한국에서 검색은 끝이 났다."라는 생각들을 여러분들이 하시는 것이었습니다.
이번 모임에서도 느낀것이지만 search는 이제 시작이고 가야할길이 참으로 먼데 한국으로서는 얼마나 큰것을 놓치고 있는것일까 하는것입니다. 한회사가 너무 잘하다 보니 그분야 자체의 발전이 늦춰지거나 퇴보될수도 있겠구나 생각이 들었습니다. 사실 검색에서도 그회사가 전체를 하는건 아닌데 말이지요. (검색을 검색과 광고와 유저커뮤니티의 세가지로 볼때 N사는 두가지는 하고 있지만 한가지는 아직 자체기술도 없지요.)

쓰다 보니 길어 질려고 하는군요 ^^.
일단 여기서 자르고 생각나면 다음기회에 조금더 적어 보겠습니다.

기계악취로 가득한 거미줄에 사람냄새나는 모든 활동을 후원합니다^^
태우님의 여행으로 한국 웹이 사람의 관계로 엮여있다는걸 잘 보여 주시길 바랍니다.

그건 그렇고...
돈은 못 보내 드리고 (보내드릴방법이 마땅치 않아서요^^)
Flickr의 co-founder Stewart Butterfield 와의 인터뷰를 마련해 드립니다.

재미를 끝까지 잃지 않으시길 ^^

저에게 블로그의 다른재미는 어떤 경로로 이블로그를 오는지 보는것입니다.
오늘 보니 어떤분이 검색을 통해 들어 오셨더군요.
검색어는 "구글스타벅스"입니다.

구글의 1위 결과와 야후의 1위결과가 모두 제 블로그 이더군요.

야후결과보기
구글결과보기

이글이 과연 두 엔진의 1위에 와야 할지가 참 의문이군요.
네이버는 이미 이런식으로 웹검색을 바꾸어 버린지 몇달이 된듯한데...
참고로 네이버의결과 입니다.

네이버결과보기

이슈검색이라면 블로그 글이 1위에 오는게 그리 크게 이상하지 않지만 두회사에 대한 정보 검색이었다면 정확도가 그리 크지 않은듯 한데...
"이슈"검색과 전형적인 "정보"검색의 변환점에 우리가 와있는게 아닌가 싶기도 합니다.
아니면 이슈와 정보라는게 어짜피 하나가 되어 가는건지도 모르겠습니다.

그 검색으로 들어오신분이 이글을 다시 보신다면 결과에 만족하셨는지 물어 보고 싶네요.
실망하셨나요? ^^  

검색쪽에 계신분들은 많이 들어 보신 것중에 하나가 "navigational query"라는건데요...
어떤 검색어들은 유저가 원하는 결과 페이지가 고정되어 있다는 가정입니다.
"Yahoo"라고 검색어를 치면 http://yahoo.com으로 갈것을 생각하는건데요.
물론 예외의 경우도 있지만 아주 많은경우에 해당합니다.

어제 "daylight savings"라는 검색어를 야후와 구글에 봤는데 결과 페이지가 미묘하게 차이가 나더군요.

야후 결과 보기
구글 결과 보기

두곳다 1위 결과만 보시면 됩니다.

야후는 보다 일반적인 daylight savings time에 대한 설명 페이지로 보내주고 구글은 언제 시간이 바뀌는지 알려 주는 페이지로 보내 주는군요.
야후는 "shortcut"이라는 유저가 원할만한 정보를 가장위에 보여주고 있기는 합니다.

여러분은 "일광시간절약제" 이런 검색어에 어떤 페이지를 원하실까요?

 이전  1234   다음 

web counter fotowall :: ncloud RSS Feeds today : 0   yesterday : 0
total : 114,930