NOTICE 
최근에 이걸 발표한걸 아시는분은 많지 않으실듯하지만 Yahoo!가 크롤러를 바꿨습니다.
많은 분들이 Yahoo! 크롤러가 너무 들이댄다고 불만이 많으셨는데요^^
어떻게 이제 좀 줄어든 느낌이 나시나요?
한국문서에는 더 좋아진 크롤러인데요, 작지만 하나하나 계속 향상되는 야후검색.
이걸 만드는 기쁨이 큽니다 :)

  
트랙백 1  |  댓글   |
아, 그랬군요.

네.. 대충 눈짐작으로만 봐도 한 절반 수준으로 줄어들었습니다.
2007.08.30 14:11
널리 알려 주셔서 감사합니다 :)

2007.08.31 03:09 신고

비밀댓글입니다
2007.10.29 19:51

요즘 소식이 없으셔서... 잘 지내고 계신지요?^^
2008.12.29 19:25

이미 아시는분들이 많겠지만 혹 모르시는분들을 위해 알려 드립니다.
지난주에 Canada Banff에서 WWW 2007 conference가 열렸습니다.
거기서 발표되었던 페이퍼들이 모두 접근이 가능하군요.
Proceedings: http://www2007.org/proceedings.html
Workshop: http://www2007.org/prog-Workshops.php

당분간 읽을꺼리가 있어서 즐겁겠습니다 ^^

우선 제 눈길을 끄는 몇가지 논문들은 아래와 같습니다.
(읽어 보고 포스팅할만한건 하나씩 따로 써보도록 하겠습니다. 미루기 작전 ^^;;)

Fact Search:
Organizing and Searching the World Wide Web of Facts — Step Two: Harnessing the Wisdom of the Crowds
하니가모님 스폐셜 ^^;;
이거 저자 이메일이 mars@google.com 이군요.
수신제가님이 언제 구글로 가셨나?

블로그 sentiment(positive,negative, neutural):
Topic Sentiment Mixture: Modeling Facets and Opinions in Weblogs
이건 여러회사에서 시도했었고 아마 지금도 어느팀은 하고 있겠죠 ^^;;
제 블로그에 가끔 오시는 어느분도 이 비슷한걸 하셨던걸로 압니다만 ^^.
틀린점은 이것보다 조금더 발전된걸 하셨던 기억이...
논문 내세요~~~

블로그 이슈:
BlogScope: Spatio-temporal Analysis of the Blogosphere  
블로그의 특성상 "burst"되는 이슈들이나 쿼리들에 대한 알고리듬입니다.
요즘 블로그 검색들이 많이들 관심있어하는 분야 인듯 합니다.

라이프 로그:
Life is Sharable: Mechanisms to Support and Sustain Blogging Life Experience  
올라로그가 많이 생각나는 논문입니다.
올라로그 서두르셔야 겠어요 ^^
RFID나 카메라폰등 지금 있는기기들을 이용한 라이프 로깅.

블로그 분류:
Exploring in the Weblog Space by Detecting Informative and Affective Articles
블로그를 일상기록적인것과 뉴스나 테크놀로지에대한 정보,의견의 두가지로 나누어서 보는 입장입니다.

블로그 스팸 처리:
Splog Detection Using Self-similarity Analysis on Blog Temporal Dynamics
일반블로그글들이 퍼블리쉬되는 시간과 제목 링크가 아주 다양한 반면에 스팸이 올라오는 시간과 제목 링크가 어떤 패턴이 있다는 면에서 쓴듯합니다.


일단 이것들을 다읽고 다른 논문에 눈을 돌려 보도록 할 생각입니다 ^^

요즘 스팸 관련한 논문을 쓰고 있는데, 제가 생각하는 스팸처리가 아니라 다행이네요. ㅋㅋㅋ 별건 아니지만, 나름 재밋게 만들고 있습니다.
2007.05.16 10:06

멋진 정보가 가득이네요!! 게다가 관심만땅 정보들입니다.
감사~ 감사~
2007.05.16 21:07

땡큐입니다. ^^ phrase를 건너뛰고 fact로 달려가고 싶은 심정이 굴뚝같습니다만....쩌비...
2007.06.17 19:54

지난 금요일 UC Berkeley에서 있었던 "The Future of Search" 모임에 다녀 왔습니다.

Academia와 industry가 한자리에 모여서 하루를 같이 보내는것만으로도 참 좋은 기회였던것 같습니다. 아무래도 학계와 업계는 밀접한듯 하면서도 또 많이 떨어져 있거든요.
학계에서는 키워놓은 학생들 가져가는데만 업계가 관심이 있는게 아닌가 우려 하기도 하구요^^

제일 먼저 눈에 띄는것은 연령층이었습니다. 지금껏 가본 이런 search에 관련된 세미나 가운데 제일 나이층이 높더군요 50 밑은 한참 어려 보였습니다. 한 50은 넘어야  낄수 있구요. 60넘어 뵈는 분들도 상당히 많이 계셧습니다. 제 앞에 않이 계셨던 노 교수님이 맥북에 Ubantu를 깔아서 eclipse로 무슨 program을 계속 짜면서 실행 시키시던게 아주 신선한 충격이었습니다.

올초 한국에서 있었던 "Social Search Brunch" 처럼 이번 모임도 search가 어디로 갈지를 같이 한번 이야기 해보는 자리였는데요, 조금 달랐던건 학계와 업계가 같이 모일수 있었던것 같습니다.
그럼 Future를 뭐라고 다들 생각했을까요?

아마 이 모임을 주최한 CITRIS측에서는 아래 세가지에 검색의 미래가 있다고 생각한듯 합니다. 크게 세가지 큰 panel session이 있었는데요,

  • NLP(자연언어 처리)
  • Communities and Search
  • Multi-Media

학계측에서는 검색을 "Question & Answer"로 많이 접근들을 하셨습니다.
Oren Etzioni 교수는 TextRunner 라는 것을 통해 "Fact search"를 보여 주셨구요,( 이대목에서 하니가모님이 많이 생각 나던데 ^^) 이어서 나온 Lotfi A. Zadeh 노교수님은 그런 "Fact search"식의 probablistic approach나 fuzzy logic의 한계를 정의 해주셨구요 아주 독특한 방식으로(직설화법 ^^) 그런 접근은 실패 할수 밖에 없다고 말씀하셨습니다. 아쉬웠던것은 한계를 보여 주신것은 좋았는데 대안은  말씀안하시고 들어 가셔서 대략 난감...

그리고 이 위의 fact search같은 비슷한 이야기들이 나왔구요.
기억에 남는 한 phrase는 "find! not search"라는... ^^

구글의 Peter Norvig 아저씨는 future를 "artificial intelligence"에서 찾으셨구요 (이 아자씨 background가 그쪽이다 보니 ^^) 야후는 음... 다음 기회에 한번 길게 쓸꼐요 ^^.

학계쪽은 아무래도 구글의 AI를 좋아 하시나 봅니다. 진행자가 이런 농담을 하시더군요.
"So, google found future from artificial intelligence and Yahoo found future from human's stupidity!"

노 코멘트 할랍니다 저는 :)

지난번 한국 출장에서 느낀것중에 하나가 "한국에서 검색은 끝이 났다."라는 생각들을 여러분들이 하시는 것이었습니다.
이번 모임에서도 느낀것이지만 search는 이제 시작이고 가야할길이 참으로 먼데 한국으로서는 얼마나 큰것을 놓치고 있는것일까 하는것입니다. 한회사가 너무 잘하다 보니 그분야 자체의 발전이 늦춰지거나 퇴보될수도 있겠구나 생각이 들었습니다. 사실 검색에서도 그회사가 전체를 하는건 아닌데 말이지요. (검색을 검색과 광고와 유저커뮤니티의 세가지로 볼때 N사는 두가지는 하고 있지만 한가지는 아직 자체기술도 없지요.)

쓰다 보니 길어 질려고 하는군요 ^^.
일단 여기서 자르고 생각나면 다음기회에 조금더 적어 보겠습니다.

제가 아는 분들은 다 검색 시작하시던데 ^^
2007.05.06 15:23
그 검색을 시작하시는 몇몇분들의 말씀이었는데요 ^^;;
아마도 통검을 말씀하셨던것이겠지요.

2007.05.07 00:51 신고

오희려 저는 "human's stupidity" 이문장을 보고 하니가모님이 생각나는데요 ^^
2007.05.07 02:59

안녕하세요? 다음에서 이미지 검색을 담당하고 있습니다. 혹시 Multi-Media session은 어땠어요?
2007.05.07 13:48
이미지 검색은 주로 UC Berkely 분들이 이야기 했는데 주로 동영상에서의 similality검색 방법( 색을 이용한 signature나 sound의signature), image 검색에서 왜 riya가 처음에는 사람얼굴인식을 내세웠지만 사람의 뇌는 이미 얼굴인식에는 너무 자신이 있어서 약간의 오차로서도 유저에게 아주 큰 실망이었고 하지만 상품은 오차의 범위를 유저가 아주 잘 받아 들였다는 뭐 그런이야기들이었습니다. 가야할길인듯 하지만 아직 어느 누구도 제데로 잘 하지 못하고 있는 분야 인듯 합니다.^^ BIG-3(Y!,G, M)가 다들 이쪽에 투자는 많이 하고 있지만 아직 설득력있는 제품은 딱히 없죠.
참 다음 웹검색 축하 드립니다 :)

2007.05.08 07:57 신고
Content-based image retrieval (CBIR) 주제로 shawn newsam http://www.snewsam.com/ 교수님이 발표를 했었습니다. 이미지 쿼리 방식에 대한 연구 결과를 기대 했는데 10년전이나 그리 많이 변한게 없는듯 하더군요. 제 분야가 아니라 그렇게 느낀것일수도 있지만요.

2007.05.16 09:33 신고

저도 검색은 이제 시작이라고 봅니다. AI로 학위를 한 저도 AI 보다는 아직은 어떻게 하면 collective intelligence를 활용할 수 있는가에 더 관심이 많습니다. 미국에서 이런 정보를 자주 주시면 더 자극이 됩니다. 언제 서울에 오시면 한 번 만났으면 합니다.
2007.05.15 16:48
안녕하세요? ^^
레뷰 2.0 오픈 축하 드립니다.
어제 오늘 열심히 살펴 보고 있었습니다.
안그래도 prak님과 좋은 시간을 가지신듯해서 부러워 하고 있었는데 꼭 찾아 뵐께요 ^^

2007.05.16 04:00 신고

5678
문득 들렸더니...좋은 정보 감사합니다. 비록 지금은 읽을 시간이 없지만, 그래도 정보를 가지고 있다는 것하고 없다는 것하고의 차이는,
2007.05.17 13:41

지난 금요일 스탠포드대학의 미래학자 Paul Saffo가 회사에 왔었습니다. 야후의 Bradley Horowitz와 이런 저런 이야기를 나누었는데요 미래학자라는 기대를 너무 했었는지 약간 기대를 어긋난감이 있었습니다. 역시 제 그릇만큼만 볼수 있는것이겠지요.

우선 기억에 남는 몇가지를 정리하면,

1. 모든 변화는 오랜 시간을 두고 일어난다.
성공한것들은 하루아침에 일어난게 아니라 오랜 실패 뒤라는 교과서적인...

사용자 삽입 이미지

from Paul Saffo http://www.saffo.com/journal/index.php


2. 야후의 DNA는 사람에 대한 관심이고 구글의 DNA는 알고리듬에 대한 애정이다.
물론 긍정과 부정의 두가지 측면으로 볼수 있겠지만 저에겐 긍정의 의미로 다가옵니다. 제가 평소에 그리던 야후의 이미지 였기 떄문에...

3. 야후와 구글의 시장은 제로썸이 아니다.
미래를 연구하는 분의 말이기에 그대로 믿고 싶지만 한치앞도 잘못보는 저는 한국포털의 경우 제로썸이 될것이라는 생각이 더 드는데...

4. 역사는 반복하지만 절대 같은 모습으로 나타나지는 않는다.
이 변형된 역사의 모습을 발견하는 것이 누구나 할수 있는것은 아닌것 같습니다.


또 한가지 재미 있는것은 이분을 만나는 거의 모든 사람들이 물어 보는 제일 첫 질문은 아래와 같다더군요.


어느 주식이 뜹니까?
비밀댓글입니다
2007.01.22 13:52

비밀댓글입니다
2007.01.25 13:46

구글은 누누히 자신들은 포털이 아니고, 될 생각도 없다고 강조했었죠. ㅎㅎ 좋은글 잘 보고 갑니다.
2007.01.31 08:45 신고

야후의 창립자 제리 양과 데이빗 파일로는 매년 연말이면 세계 야후 직원에게 선물을 하나씩 줍니다. 주로 옷이나 가방 아니면 서비스들을 하나씩 줬는데요...

올해의 선물은...

100불을 내가 원하는 자선단체에 기부할수 있는 선물을 했군요.

다른 선물 받을때도 기분이 좋았지만 이번은 "조금" 더 기쁘네요.

말도 많았고 일도 많았던 야후의 한해였고 창립자들의 빛이 사그라든것 아니냐고 까지 하는기사들을 봤었는데 뭐 이만하면 저는 아직 데이빗과 제리에게 점수를 후하게 주겠습니다.^^

제 선택은 여기로 갔습니다.

이게 제 주머니도 열게 하는군요 ^^;;

Seasons of Giving!!!
Happy Holidays!!!
야후 다니시나봐요?
전 95년부터 97년까지 실리콘 밸리에 있었는데..ㅋㅋ
2000년 까지는 들락거렸..
지금은 많이 바꿨을라나..
2006.12.21 02:49 신고
회사들이 생겼다 사라졌다 한거외에는 여전합니다 ^^

2006.12.21 05:22 신고

kimo
닷컴에 계시는군요. 이번 선물은 약간 아쉽습니다. donation은 좋지만.. local별로 사이트를 선정해서 도울 수 있었으면 더 낫지 않았을까요?
2006.12.23 22:32
뉘신지 ^^
네 저도 처음엔 한국관련 단체를 한번 찾아 봤지만 쉽지 않더군요.
미국에 있는 한국 관련단체들이라서 조금 미덥지도 않구요.
한국에도 이런 단체 모음 웹사이트가 있으면 backyard에 한번 건의 해 보심이... ^^
인도는 꽤크게 있더라구요.
Happy Holidays~~

2006.12.24 06:01 신고

Favicon of http://pariscom.info
네이버에 가면(야후 계시는 분께 말하기는 뭣하지만;;) 이런 단체들 왕창 등록해 놓고 원하는 곳 또는 사람에게 기부할 수 있는 코너가 있어요..(해피빈이라고..)
2006.12.25 14:44
안녕하세요?
좋은 정보 감사합니다.
야후에도 "나누리"라고 "해피빈"과 비슷한일을 하는 코너가 있어요^^
다만 이번 제리의 선물로는 이런 사이트를 통해서 기부를 할수가 없어서요, 그래서 kimo님이 아쉬워 하셨던것 같습니다.
연말연시 잘보내세요~

2006.12.27 07:35 신고

석달에 한번씩 hackday라는것을 합니다.
이게 다음주로 돌아 왔네요.

Yahoo Hackday는 두가지 룰만 지키면 됩니다.

  • Take a concept from idea to prototype in one day [하루안에 아이디어에서 프로토 타입까지 만들수 있어야 한다]
  • At the end of the day, demo to your colleagues (usually in a very constricted time slot) [hackday가 끝날때 내가만든걸 짧게 demo해야한다]

생각보다 아주 재미있는 것들이 나오게 됩니다.
hackday를 이렇게 다시 정의 한 사람들도 있습니다.

Every good work of software starts by scratching a developer's personal itch. To solve an interesting problem, start by finding a problem that is interesting to you.
Eric Raymond, The Cathedral and the Bazaar

Don't bullshit. . . just play.
Wynton Marsalis (the jazz version of "mashup or shutup")
제가 hackday에 했던것도 production에 점깐 나간적도 있습니다.
그냥 재미로 끝나는건 아닌거죠^^
혹 이런걸 준비하실수 있는분들은 한번 해보세요.
하루를 비워주시면 되고 먹을것만 잔뜩 준비해주시면 됩니다.
하루가 끝날때 아마 서로 놀라시게 될거예요.


오늘 워드프레스의 Founder Matt Mullenweg가 와서 "The first 100k users are always the hardest"라는 토픽으로 이야기 했다.

아침부터 이상한 미팅자리에 끼게 되어서 말할수도 말하지 않을수도 없는 묘한 줄타기를 하다가 그 찝찝한 기분을 말끔히 씻어 주는 토크였다.

CK님과 Chester님 정도의 나이로 보이는데 시종일관 백전 노장처럼 경험에서 우러 나오는 startup만의 이야기들을 들을수 있었다.

Matt는 12가지 회사를 성장시키는 룰을 이야기 했는데,

  1. Be your first user.
  2. Get off the computer.
  3. Obsess about the details, down to the space between two letters.
  4. Do your own support.
  5. Blog every step of the way.
  6. Have a tagline.
  7. Talk about THEM.
  8. Get out of version 1.0 as fast as possible.
  9. Measure everything.
  10. Enjoy Success - dog chasing a car doesn’t know what to do if he catches it.
  11. Start strong and end strong.
  12. Be a pain killer not a vitamin.


여러가지가 CK님이 이미 말씀 하셨던것과 일치하는걸 보면 같은 일을 하는 똑똑한 사람들은 아마 비슷한 생각들을 하나 싶기도 하다.

몇가지 다시 짚어보면,

Do your own support.
CEO부터 누구나가 다 유저 support를 한단다. 그래야 정말 유저가 뭘원하는지 직접 느낄수 있다고, support email은 모든 직원에게 간다고 한다. 암호를 어디서 바꾸죠 같은 질문들... Matt는 자기시간 10%를 user support에 쓴단다.

Have a tagline.
말하고 싶은 걸 짧은 몇 단어로 만들어 보란다. 이건 나의 경험으로도 정말 필요한것 같다. 너무나 많은 정보 홍수의 가이드라인이나 설명 페이지들 보다는 한두단어로 설명된 서비스들이 훨씬 그 서비스를 잘 알려 줄때가 있다. 또한 이건 서비스를 디자인 할때도 적용 되는것 같다. 몇 단어로 설명되지 않는 서비스는 역시 유저들에게도 쉽게 다가가지 못한다는것. 제일 좋아 하는 tagline은 del.icio.us의 세 단어 였는데 세 문장으로 바뀐 지금도 역시 제일 마음에 든다.
» all your bookmarks in one place
» bookmark things for yourself and friends
» check out what other people are bookmarking

Talk about THEM.
기술력을 앞세우고 싶은 욕심은 어느 엔지녀/회사들에게나 있다. "우리 회사는 첨단 씨멘틱 웹 기술을 바탕으로..." 하지만 포커스가 유저에게 가야한다고 말한다. publish하기가 얼마나 쉬운가, 얼마나 communication이 쉬워 졌는가 등등. 
"It's NOT ABOUT THE TOOL."

Get out of version 1.0 as fast as possible.
가장 공감가고 아쉬운 부분이다. 회사가 몸집이 커질수록 약해지는 부분...
Matt는 "BETA" 마저도 아니라고 한다. 1.0 그래 이거다.
얼마나 일하면서 아쉬운 부분인지...

Measure Everything.
거의 모든걸 자료화 한단다.
그러다 보니 워드프레스 유저의 8%가 Flickr를 쓰는걸 발견하게 되고 그기능을 넣게 되고...

Be a pain killer not a vitamin.
참 비타민 시장이 큰것 같다.
여기저기 웰빙, 건강식품 하지만 그 시장이 타이레놀 하나보다 작단다.
타이레놀 같은 걸 만들어야 한다고...

기업은 문화란 생각이 참 많이 들었었는데 오늘 다시 한번 그걸 확인 시켜주는 토크 였다.

멋진 insight 전달해 주셔서 감사합니다.
그런데 Have a Tagline은 무슨 의미였었나요?
2006.11.12 17:02
본문으로 포함 시켰습니다^^

다시 쓰고 나니 또 빼먹었는데 그건 그냥 여기에,
tagline도 하나가 아닌 여럿을 만들어 보길 권하더군요. 단어로 된것 문장으로 된것 다른 대상을 향해서 등등등...
좋은 한주 되세요.

2006.11.13 11:47 신고

SRI International이오늘 60번째 생일을 맞았다.

8년간 다녔던 전 직장에서는 SRI와의 교류가 무척 많았었다.
책상마다 수북히 쌓인 논문들 사이로 발디딜틈 없던 연구실들,
한창의 닷컴 버블때에도 한눈 파는 사람없이 각자의 연구에 미쳐있던 연구원들,
핏자 한판 시켜놓고 망원경으로 별보며 그리도 할말 많던 사람들...
이전과 전혀 다른 회사에 들어와 슬슬 적응되가는 지금, 그사람들이 더더욱 보고 싶다.

실리콘 밸리가 지금처럼 자리잡기에는 많은 요인들이 있었지만 SRI같은 연구소의 역활이 없이는 제대로 설명하기가 힘들다.
우리가 잘아는 마우스, 지금의 인터넷의 원조 ARPANET, 인터넷 뱅킹의 원조인 전자뱅킹   등등등 모두다 SRI에서 만들었거나 큰 역활을 한것 들이다.

웹 2.0을 놓고 한국 정부가 어떤 지원을 할것인지 요즈음 이메일들이 오가는 것을 지켜 봤다.
의미조차 명확하지 않은 웹2.0 보다는 이런 연구소에 팍팍 지원좀 하는게 어떨지...
Hollobit님이 계신 ETRI가 그런곳이 아닐까?

예전 직장(연구소)에서 계획을 세울때의 가이드 라인이 생각난다.
"6개월 후는 회사에 맡기고, 3-5년후는 학교에 맡기고 우리는 10년후를 계획 한다."
그래서 실제로 2010에 뭐 할지 적어내고 했었다는...
Favicon of http://memoriesreloaded.net CK
블로그 제목보고 혹시 뭐가 잘못된건가 다시한번 봤습니다. ㅠㅠ
2006.11.08 10:50
집장만 까지 해주시고 감사합니다!
역시 블로그찾아 주시면서 까지 QA 작업하시는 멀티 태스킹을...


2006.11.08 11:20

 이전  1   다음 

web counter fotowall :: ncloud RSS Feeds today : 0   yesterday : 0
total : 114,959