NOTICE 
최근에 이걸 발표한걸 아시는분은 많지 않으실듯하지만 Yahoo!가 크롤러를 바꿨습니다.
많은 분들이 Yahoo! 크롤러가 너무 들이댄다고 불만이 많으셨는데요^^
어떻게 이제 좀 줄어든 느낌이 나시나요?
한국문서에는 더 좋아진 크롤러인데요, 작지만 하나하나 계속 향상되는 야후검색.
이걸 만드는 기쁨이 큽니다 :)

  
트랙백 1  |  댓글   |
아, 그랬군요.

네.. 대충 눈짐작으로만 봐도 한 절반 수준으로 줄어들었습니다.
2007.08.30 14:11
널리 알려 주셔서 감사합니다 :)

2007.08.31 03:09 신고

비밀댓글입니다
2007.10.29 19:51

요즘 소식이 없으셔서... 잘 지내고 계신지요?^^
2008.12.29 19:25

jmirror님이 블로그 검색에관한 블로거 간담회를 여신다고 하는군요.
저도 가봤으면하고 둘러 보다가 그만님의 트랙백을 보게 되었습니다.
그만님의 "말하기 싫게 만드는 말 10"의 도용 사례와 각 검색엔진들의 결과를 예로 들어 주시고 "국산"과 "외산"으로 구분하여 주셨는데요...

같은 말일지 모르겠지만 제 생각에는 그만님의 도용건은 "기술"의 문제가 아니라 "정책"의 문제일듯 합니다.
블로그 검색은 저희 선수(?)들이 말하는 vertical 검색이라기 보다는 web검색에 가까운 특징을 가지고 있습니다. 활발한 링크와 문서간의 anchor text를 통한 교류가 아주 활성화된 분야 입니다. 그만님같은 탑블로거의 경우 이미 pagerank라고 하는(야후는 다른말을 쓰지만^^) 웹링크 분석의 값이 상당히 높아 아주 초보적인 수준의 링크 계산으로도 검색결과에서 위의 블로그가 탑으로 나올수 있습니다.
문제는 이 링크 계산을 다른 포털들이 안쓰거나 "정책"상으로 무시하는것이겠지요.

하지만 반대의 경우는 "기술"적으로 상당히 어려울수 있습니다. 가령 jmirror님이나 그만님이 일반블로거의 글을 도용하셨을경우 링크 계산만으로는 누가 원저자인지 알기가 상당히 힘들겠지요. jmirror님이 한번 테스트 해보시지요 ^^ 아마 Y,G,M에서는 탑으로 나온다는거에 500원 걸겠습니다 :) 뭐 이경우야 학력위조사건처럼 나중에 큰일 나는걸 아실테니 안하실듯 하구요 ^^

그러면 위의 경우는 어떻게 해결할까요?
단순히 글쓴시간만으로는 힘든것이 시간대를 블로거가 조작할수도 있고 크롤된 시간만으로는 아주 부정확하구요.
CCL은 어떨까요?
하지만 제가 쓰는 tistory나 태터의 경우 CCL이 마치 자동으로 선택만 해놓으면 모든 글에 붙게 됩니다. 펌글이든 원글이던 간에요. 그래서 CCL의 원래 의미를 찾기가 상당히 힘들게 되어 버렸는데요.
그러면 비영리 저작권 사이트를 만들어서 등록을 시킬까요? :)
mycopyrights.org
이건 뭐 업계와 블로거 모두가 참여해야 하는것이니 쉬운일은 아니겠네요.

야후코리아는 빨리  비슷한 블로그를 열람할수 있는 기능을 만들어 주세요^^
누가 원저자인지는 확인 못해도 비슷한글들이 어디어디에 퍼져 있는지만 알아도 많은 도움이 되겠어요. 

재미난 토론, 생산적인 토론 하시고 결과는 블로그로 또 널리 알려 주세요 ^^

  
트랙백 0  |  댓글   |
좋은 글입니다. 두개의 블로그 글이 동일한 글인지 아닌지 판단하는 것도 쉽지 않은데, 동일한 글일 때 어느 글이 원본인가 찾아내는 건 더 어려운 문제라고 생가합니다.
2007.08.25 13:35
평소 그 블로거가 펌글을 많이 하는 블로거인지 아닌지를 정보를 쌓아 두면 어떨까요? 서치에서 많이 하는 개념인데 뭐 블로거에게도 적용되겠네요. 펌글자주 하시는분들이 또 하실 가능성이 ^^

2007.08.25 14:07 신고

디지탈은 그 본질상 '복제'가 존재 이유입니다. 원본이란 개념 자체가 희박해진다는... 검색엔진은 더 똑똑해져야 하고... 사용자들은 더 원하는게 많아집니다. 쉬운 일이 아닌데, 그 근본 특성상 시간이나 기타 드러나는 정보 만큼이나 anchor text 교류 정보를 중량감 있게 반영하는게 관건이 될 것 같습니다. 결국 페이지랭크 얘기로 귀결되는 건가요... 헐헐

좋은 글 감사합니다.^^

아 그리고 한국은 아직 안오세요?^^
2007.08.25 23:22
펌글이야기가 많이 나오고 그것의 처리에 대한 고민들이 있지만 사실 그부분보다 블로그라는것에대한 근본적인 가치 판단에 이야기들이 더 모아 졌으면 좋겠어요^^ 그러다 보면 펌글도 같이 처리가 되지 않을까 하는 희망이...

아 그리고 한국출장... 그러게요. 언제나 가나? ^^
그리고 늦은 축하 드립니다.

2007.08.28 01:18 신고

네 좋은 아이디어십니다. 중복에 대해서는 웹문서 검색의 tiering 개념을 가져갈려고 생각하고 있습니다. 이슈n의 유사한 문서 클러스터링과 비슷할 수 있습니다. 서비스 모양새는 원본을 우선 보여주고 중복처리되었던 문서도 원할 경우 버튼 하나로 확장해서 보여주는 거지요. 사실 이번 버전 오픈은 노력도 많이 했지만 아쉬움도 많은 버전이었습니다. 좋은 의견들 모아서 업그레이드 바로 해보지요~~
2007.08.26 20:48
수고가 많으세요 :)
팀블로그면 누가또 같이 하시나요?
기왕이면 서치 블로그도 야로로(영) 팀 브롤거가 같이 장악해버리시지요 ^^
그러면 조만간 뵙겠습니다.

2007.08.28 01:22 신고

오늘 어떤 분의 장례식 초대장을 받았습니다.
고인이 돌아가시기전에 작성하신 글인듯 했는데 마음에 계속 남는군요.
(아니면 어떤 분의 시인지도 모르겠습니다만...)

저도 이런글을 남길수 있는 마음의 여유를 배워야 겠습니다.

To my Friends, Those I Loved

When I am gone, release me, let me go.
Be thankful for the good times.
I would have loved to have known you longer
To understand, work with you, and play.

You gave me your friendship and I gave you mine,
You may never know how much happiness I received at the time.

So grieve for me a while, if you must
Then be comfirted by trust
You will feel my love
I will always be in your heart

Remember the good times.

비밀댓글입니다
2007.07.06 07:55
ㅠ.ㅠ 연기 되었습니다.
근데 정보력이 빠르시네요 ^^
다음에 가면 꼭 찾아 뵙게습니다.

2007.07.06 09:21 신고

비밀댓글입니다
2007.07.06 09:31
오호 그런거라면 안가도 들어 드릴수 있는데^^
그런데 이제 물건이 동나서 2달 걸린다던데요?
관심있으시면 알려 주세요.

2007.07.06 12:35 신고

비밀댓글입니다
2007.07.06 12:49

멋진 글입니다...
2007.08.10 14:10 신고

잘보고갑니다~
2018.08.05 14:51 신고

 이전  1234···13   다음 

web counter fotowall :: ncloud RSS Feeds today : 0   yesterday : 0
total : 114,959