'알고리즘'에 해당되는 글 2건

  1. 2015.01.23 <미디어> 알고리즘의 그림자, 진짜 뉴스와 가짜 뉴스
  2. 2011.09.19 <생각조종자들> 당신에게 위험한, 친근한 세상 (1)

<미디어> 알고리즘의 그림자, 진짜 뉴스와 가짜 뉴스

미디어 2015. 1. 23. 19:39

 

 빡센 야근에 이어 종일 달린 날이라 일찍 퇴근하려는데 C가 한 번 읽어보라며 툭 던진 기사 하나에 낚였습니다어찌나 재미난지 덮었던 노트북을 다시 열고 검색을 시작했습니다기사 원문을 찾고 싶었으나 실패. <Wired> 2015 The World Trend Report 특별 한국판입니다. ‘전 세계 전문가들이 필진으로 참여곧 닥칠 미래에 대한 크고 작은 100여 가지 아이디어로 가득한 책입니다이쯤 홍보(?) 해드렸으니제가 아래에 베껴 쓴 대목에 대해 저작권 침해를 따지지 않아주시면 좋겠습니다.^^;;  <정치 선전의 스마트화>란 제목은 그다지 근사해보이지 않은데 PROPAGANDA BOTS TO PROTESTS 가 원제인지, AGENDA-BOTS 인지 하여간에ㅎㅎ 

 



Sean Gourley. 정보분석업체인가요? Quid 의 공동 창업자, 물리학자이고 정치 자문? 아주 훈훈한 청년인 듯 보이는데, 이 분 글에 홀딱 넘어갔습니다. 너무 신나고 재미있는게 아니라 당혹스럽고, 생각이 복잡해져서요. 그러나 한 번 보시죠. 제 능력으로는 원문 찾는 데도 실패하고 어쩔 수 없이 베낀 거 아닙니까. 그러나 이런 이야기를 나누는 것은 너무 재미난 일이라.... 저는 이 분 트위터 팔로잉도 시작했어요.  


자.. 그럼, 정말 빛의 속도로 따라 쓴.... ;;; 





2008년 미 국무부는 해외 원조기구인 국제개발처를 통해 쿠바에 가짜 SNS 서비스를 도입했다. 표면적으로는 공공의료나 시정 관련 이슈들을 부각시켰으나, 공작원들은 쿠바 내 잠재적 불만 세력을 대상으로 삼았다. 해당 SNS 사이트는 해시태그부터 가짜 광고까지 갖추고 있었으며, 각 유저들의 ‘정치 성향’을 데이터베이스화한 자료도 있었다. 2009년부터 2012년까지 미 국제개발처는 약 160만달러의 예산으로 이용자 4만 명을 보유한 정보 플랫폼을 조종할 수 있었다.


2011년 중동지역 군사작전을 담당하는 미 중앙사령부는 여기서 더 나아가 캘리포니아의 한 업체에 온라인 인물정보 관리 서비스 개발을 의뢰했다. 온라인 프로필부터 그럴듯한 배경 정보까지, 모든 것을 포함하는 서비스였다. 이 소프트웨어를 통해 미국의 공작원들은 10개의 가짜 프로필을 사용할 수 있었다. 발각될 염려 없이, 세계 어디서든 정치 공작을 수행했다.


 알고리즘은 뉴스를 읽는 것에서 나아가 뉴스를 작성한다.. 알고리즘을 통해 개인별 맞춤형 내용이 수록되며 독자의 사상을 바꾸거나 행동을 유발하도록 개발된다. 이미 멕시코의 마약카르텔은 라스 초아파스 지역에서 기자가 살해된 사건에 대해, 갱단이 고용한 청부살인자와 무관한 일인 것처럼 소셜 미디어 봇으로 여론조작을 한 바 있다.  1천만이 넘는 봇이 있으며 그 잠재적 활용 규모는 거의 무한하다. 해커 포럼에서 1천 개당 5~200달러에 거래되는 봇은, 그것이 얼마나 사람과 비슷한지에 따라 가격이 매겨진다.


러시아의 정보당국 역시 3천만 루블을 들여, 대규모 SNS 네트워크 상에서 자동적으로 정보를 게시하기 위한 특수 소프트웨어 개발에 나섰다. 또한 2015년에는 남미지역 정치 여론을 조작하기 위해 개발한 미국의 고도 정부 연구 프로제트의 실전 실적이 드러날 것이다.


아직은 시작에 불과하다. 2015년에 개발되는 봇은 지능을 흉내 내는 차원의 비교적 간단한 발견학습 Heuristic 기법에 기반한다. 그러나 보다 미래에는 게시된 내용에 대한 반응과 효과에 따라 내용과 게시물을 진화시킬 수 있는 유전적 Genetic 알고리즘에 기반한 봇들이 등장할 것이다.

2016년 미국 대선 즈음에는 미국 대중을 상대로 투입될 것으로 예상되며, 비교적 테크놀로지에 친숙한 민주당 뿐만 아니라 다른 정치 세력들도 활용할 것이다.


이 기술이 먹히는 이유는, 사람은 본인이 생각하는 것 이상으로 귀가 얇기 때문이다. 페이스북에서 최근 실시한 실험에서 알 수 있듯이, 이용자가 읽도록 알고리즘이 골라준 내용에 따른 이용자의 감정 반응 조작이 가능하다. 또한 MIT의 한 연구진은 게시물이 올라가자마자 추천수를 조작하면 해당 게시물에 대한 공감 정도를 25%나 높일 수 있다고 밝혔다. 반대로 문제가 없는 기사라도 초반에 비추천 숫자를 조작해 인기 없는 게시물로 만들 수 있었다. 2015, 정치 선전 봇들은 이러한 연구 결과에 기반해 뉴스피드를 조작할 것이다. 자동화된 친구들은 주어진 선전 목적에 부합하는 기사들을 리트윗하고 좋아요를 누를 것이다.


봇은 여론조작이 진행 중인지 판별하는데도 활용될 수 있다. 우크라이나 상공에서 격추된 말레이 항공 MH17편에 대한 댓글을 살펴보면, 미국과 러시아의 매체들이 세계인에게 서로 상반된 주장을 믿도록 노력했다는 걸 알 수 있다. 알고리즘을 통해 러시아와 미구그이 주류 매체에서 게시되는 내용을 모니터링하면 논조가 차이 나는 부분의 식별이 가능하다. 마찬가지로 위키피디아 같은 사이트에서 테러리스트라는 문구를 우크라이나 군으로 대체하는 등 하루에도 수백만 번 등록되는 수정사항들을 모니터링해 조작의 증거를 찾아낼 수도 있다. 물론 이것을 통해서도 어느 쪽 말이 맞는지는 알 수 없으며, 결국에는 사람의 판단이 필요할 것이다.


일단 국정원 댓글 사건이 떠오르지 않으신지. 저는 십알단 생각도 했습니다. 이게 아직은 십알단이지만, 전략 자체는 미국 정부가 해온 일과 유사합니다. 물론 미국 정부는 자국내에서는 이런 일 않는다고 늘 강조하지만, 그거야 알 수 없고. 수천 수만 댓글이 무슨 소용이 있겠냐는 둥, 논란이 많았지만, 이건 어쩌면 이미 글로벌 트렌드? 그나마 우리나라 국정원은 세금으로 많은 이들에게 일자리를 제공했다면, 이제는 propaganda bots 의 시대가 이미 와버렸나 봅니다. 물론 세금은 이제 bots 개발자들에게 쓰일 수도 있겠지만.

 

알고리즘 뉴스의 시대, 로봇이 작성하는 기사에 대해 혁신을 축으로 하는 다양한 전망이 나왔지만, 그것은 기술 중립적 이야기였습니다. 혹은 내게 필요한 맞춤형 정보를 딱 골라서 찾아주는 유용하고 스마트한 알고리즘 추천의 이야기였죠. 저런 방식으로 조작되고 왜곡될 수도 있는 미디어 트렌드 속에서 기술은 어떤 모습을 보여줄지 기대와 우려가 교차합니다. 위키피디아가 정파적 이해관계로 계속 수정된다는 것은 새롭지 않은 뉴스이지만, 하루에 수백 만 번 바꿔대는 봇들의 전쟁은 다소 차원이 달라 보입니다. 더구나 결론은…. “사람의 판단이 필요하다라는 것으로 돌아간다니, 어마어마한 기술의 시대에 IT 기업의 CTO,  물리학자의 제언으로는 아이러니한 측면이 있습니다.  


문득 또 생각합니다. 뉴스 편집이 알고리즘으로 대체되는 부분이 늘어날 가능성이 높아 보입니다. 모바일에서는 특히 이용자들에게 맞춤형 추천 콘텐츠가 주류를 이룰 것이라는 예측이 지배적입니다. 다만 이것저것 다른 측면도 따져본다면 우리는 어디쯤에서 중심을 잡아야 할까요.  스마트한 시대에 점점 스마트하지 않으면 눈 뜨고 코 베일 상황이라는건 또 어찌할까요. 트위터나 페이스북, 소셜 미디어 플랫폼들은 앞으로 점점 심각해질 불신의 딜레마에서 벗어나기 위해 또 어떤 알고리즘을 만들어내야 할까요. 기술이 기술의 함정을 극복할 것인지, 사람이 어디까지 현명해질 것인지. 기술 혁신의 시대, 생각할 꺼리는 더 늘어나고, 더 심각합니다. 너무나 흥미로워서 지금 가슴이 콩닥거리는 건지, 진짜 당황한 건지, 저도 잘 모르겠어요.

Trackbacks 0 : Comments 0

Write a comment


<생각조종자들> 당신에게 위험한, 친근한 세상

소박한 리뷰/비소설 2011. 9. 19. 02:02

생각조종자들당신의의사결정을설계하는위험한집단
카테고리 인문 > 인문학일반
지은이 엘리 프레이저 (알키, 2011년)
상세보기

당신의 비위를 맞춰주는 '친근한 세상' 증후군

‘비열한 세상 증후군’이란게 있다
. 폭력물을 많이 본 아이들은 실제 세상의 폭력에 대해 더 두려워한다. 그리고 이제는 ‘친근한 세상 증후군’이 있단다. 검색 알고리즘 필터링에 따라 당신의 비위를 슬슬 맞춰주는 결과만 보여주는 세상이다. 검색 엔진은 우리가 무엇을 클릭하는지 살펴, 우리가 원하는 것을 다시 보여준다. 구글은 2009 12월 이후 사람마다 다른 맞춤형 검색 결과를 보여준다. 구글에 더 이상 모든 이에게 동일한 표준 검색결과는 없다. 아마존은 당신의 관심을 예측, 첫 페이지에 띄워주는 방법으로 매년 수십억 달러를 번다.넷플릭스의 매출 60% 이상은 고객 선호를 예측해서 맞춤형으로 추천한 영화에서 발생한다.

dictionary.com 에서 병명을 검색하면, 최대 223개의 쿠키가 설치된다고 한다. 그 병의 처방에 관한 서비스를 팔려는 이들에게 추적된다. 요리에 대한 정보를 찾으면 주방 기구를 파는 광고가, 배우자가 불륜에 빠질지도 모른다는 선정적 문구를 클릭하면, 친자확인 DNA 검사 광고로 도배된다. 웹사이트에서 항공편을 검색하면, 이마에 “저렴한 항공편 알려달라”고 써붙이는 격이다. WSJ 조사에 의하면, CNN이나 야후,MSN 등 상위 50개 인터넷 사이트에는 평균 64개의 쿠키와 개인정보 추적용 유도 장치가 설치되어 있다고 한다. Acxiom은 미국인 96%에 대해 평균 1500종의 정보를 축적한 회사다. 신용점수는 물론, 애완동물에게 뭘 먹이는지, 당뇨약을 언제 샀는지 다 알고 있다.

똑똑한 세상의 새로운 걱정 거리. 책은 당신을 가두고 있을지도 모르는 ‘필터 버블’에 대한 이야기다. 친숙한 욕구만 더 찾게 하는 대신 통찰하면서 새롭게 배울 기회는 사라진다는 걱정에서 출발한다. 온라인 시민단체 무브온 이사장인 저자는 인터넷의 무한한 가능성을 활용하는 동시에 그 그림자를 탐구했다. 인터넷이 오히려 시야를 좁게 만들고, 무작위적 아이디어에서 자극받는 창조적 전진을 막는다면, 다양성을 제거해 새롭고 혁신적인 사고를 방해한다면 어떻게 할 것인지, 진지하게 접근한다.

실상 개별화된 맞춤형 서비스는 이용자 편의와 비즈니스의 윈윈 구조였다. 매일 90만개 블로그, 5000만개 트위터, 6000만개 페북 업뎃되는 세상, 정보의 홍수 속에서 입맛에 맞는 정보를 찾아내주는 것은 사실 고맙고 편리한 일이다.
그러나 세상사 언제든 빛과 어둠이 같이 움직이는 탓일까. 기술의 눈부신 진화가 함정에 빠졌다.

 

스마트한 세상이 어느 정도인가 하면…

인터넷에 글을 올릴 때 긍적적 단어를 많이 사용한다면, 기분이 좋다는 얘기고, 여기에 딱 맞는 콘텐츠와 광고는 어떤가. 감정 상태를 이용한 접근이 가능해진다. 심리 메커니즘이 개별화된 미디어와 결합하면, 당신의 정체성이 당신의 미디어를 형성한다. 당신의 미디어는 당신의 신뢰하는 것과 관심있어 하는 것을 형성한다. 당신은 당신을 위해 마련된 순환고리의 덫에 빠지게 된다. 인터넷이 당신을 멍청하다고 생각하면 어떻게 될까. 구글 독스는 글쓰기 수준을 자동으로 체크, 대학 수준 글을 쓰는 이에게는 <뉴요커> 수준의 글을, 수준이 낮다면 <뉴욕포스트> 같은 타블로이드 찌라시 기사를 보여줄 수 있다.

개인 데이터를 알고리즘으로 정렬한 소프트웨어는 어떤가. 예컨대 9명의 백인 응시자가 계속 선택된다면, 회사는 흑인 고용에 관심을 두지 않게 되고, 향후 검색에서 흑인을 배제하게 된다. 링크드인은 당신과 비슷한 이력서들을 비교, 당신이 앞으로 5년 뒤 어떻게 될지 경력 추적 예측 기능을 제공하는데, 거꾸로 앞으로 해고할 사람들을 골라내는 데이터를 회사측에 제공할 가능성도 배제할 수 없다. 당신 고교 동창이 빚을 갚지 않는다거나, 많은 채무 불이행자들이 좋아하는 것을 당신도 좋아한다는 이유로 은행에서 차별받을 수도 있다.
데이터 처리 비용이 급감하는 것도 간과할 수 없다. 얼굴 인식 비용은 매년 반값이 된다. DNA 기호 하나의 인식 비용은 90 10달러에서 2010 0.001센트로 떨어졌다. 이런 데이터를 프로파일링 하려는 유혹은 더 강해진다

망가진 미디어, 위태로운 민주주의


이처럼 당신의 모든 것을 당신의 행태를 기반으로 예측하는 것이 엄청나게 편리한 동시에 무시무시하다면, 이 새로운 상황이 바꿔나갈 미디어 세상은 또다른 고민을 안겨준다.

일단 미디어가 제 역할을 하면서 살아남는 자체가 어려운 과제다. “이제껏 광고에 쓴 돈의 절반은 낭비"라는 말이 나온다. 광고주들은 이제 고급 독자를 둔 뉴욕타임즈에 비싼 광고비를 지불하는 대신, 액시엄 같은 데이터 회사에서 산 정보를 활용할 수 있다. 고급 콘텐츠로 고급 독자를 잡는 시대는 끝났다. 대신 미디어는 어떻게 소비되는가.

시애틀 타임스의 2005년 톱기사는 ‘말과 섹스를 한 후 죽은 남자’, LA타임스의 2007년 톱기사는 ‘세계에서 가장 흉한 개’였다고 한다. 저자는 “구글에서는 애플에 대한 뉴스가 아프가니스탄 전쟁에 대한 뉴스보다 많다. 구글 뉴스의 통계는 인기리스트와 필터 버블의 결합이 무엇을 사라지게 만들지 예고한다. 중요하지만 거북한 일들”이라고 지적한다. 클레이 서키는 “그날의 뉴스 99%를 무시하는 평균적 시민이 민주주의에 위기가 오는 것을 제 때 알아차릴 수 있을까? 지도자들에게 부패가 너무 심해지면 가만 있지 않겠다고 어떻게 경고할 수 있을까? 과거에 신문 1면은 그 구실을 했다”고 우려를 표시한다.

기존 언론이 고고하고 잘했다는 뜻은 아니다. 퓰리처상을 만든 조지프 퓰리처는 선정적 보도의 선구자로서 스캔들, 섹스, 공포 조장, 은근한 암시 기사로 판매 부수를 늘리는 방법을 후대의 언론에게 전했다. 그런데 인터넷은 차원이 다른 세상을 열었다. 허핑턴포스트를 비롯해 인터넷 언론들은 클릭수, 트래픽 동향에 따라 기민하게 대처한다. 이용자들이 생각하는 가장 중요한 기사, 선호, 행동 패턴을 다 고려한다. 야후의 뉴스 블로그 Upshot 편집팀은 검색 데이터를 분석해 실시간 관심 단어를 찾아 상응하는 기사를 만들고 광고를 붙인다. 보고 싶은 것만 보게 하고 다양성을 제거하는 필터 버블이다. “신문의 영향력을 중화하는 유일한 방법이 복수의 신문사라는 사실은 미합중국 정치과학의 원칙”이라고 미디어 다양성을 강조했던 알렉시스 드 토크빌의 말이 무색하다.


국내 포털 미디어의 고민

이 상황은 국내 네이버 뉴스캐스트를 통해 앞다퉈 선정적 편집에 나선 언론사들의 행태와도 무관하지 않다
. 네이버는 뉴스 편집권한의 독점적 영향력을 스스로 줄이고자, 첫 페이지의 가장 좋은 자리를 언론사에게 내줬다. 결과는 저 시애틀 타임스의 황당한 톱기사 같은 기사들로 도배질된 대문이다. 다음의 경우, 차라리 상황이 낫다. 처음부터 뉴미디어를 표방하는데 주저하지 않았던 다음은 편집에 대한 온갖 시비를 감수해야 했다. 트래픽만 따지면, 연예 찔아시 기사들을 톱으로 올려야 했겠지만, 이 같은 시비 과정에서 미디어의 공공성을 보여주지 않고는 배겨날 수 없었다. 이 과정에서 모든 편집 내용을 투명하게 공개하는 미디어다음 뉴스통계는 사실 꽤 괜찮은 아이디어다. 정치, 사회, 경제, 문화, 연예, 스포츠 등을 각각 몇%씩 대문에 걸었는지, , 시간대별 편집을 공개하는 것은 자체 감시 기능은 한다. 무턱대고 개와 섹스 따위의 기사를 차마 못 올리는 구조랄까.

국내 포털에게 왜 그 기사를 톱에 걸었냐, 무슨 기준이냐고 할 때면, “왜 조선일보 1면 톱은 오늘 저 기사일까요라고 반문했다. 미디어의 편집 내역은 기준을 따지기 어렵다. 어떤 분들은 구글처럼 알고리즘으로 기사를 배치하지 않고, 사람의 손을 거치는 편집에 불만을 표시했다. 그러나 알고리즘이 미디어와 결합되는 것이 과연 최선일까? 그것이 맞춤형이라면 더더욱 이건 결코 간단한 문제가 아니다. 특히 국내 풍토에서 포털이 알고리즘에 따라 기사를 배치한다면, 알고리즘의 로직이 뭐냐고 시비가 붙을게다. 이 문제는 편집한 부분에 대해 책임을 다 하면 된다고 보지만, 싫으면 중이 떠나라는 식의 접근도 현실적이지는 않다. 실제 미디어 이용자들도 고착되면, 잘 움직이지 않는다.

필터 버블의 함정 vs 알고리즘 어뷰징 위협
저자는 필터 버블에 대한 확신을 갖고 다양한 사례를 전한다
. 다만, 저자는 구글과 페이스북에 대한 반감이 객관적 판단의 범위를 넘어선게 아닌가 싶기도 하다. 예컨대 구글 창업자 페이지와 브린에 대해 스탠퍼드대 시절 교수의 입을 빌어 권위에 대해 다소 냉소적 측면이 있었다. 그들은 세상이 자신들의 생각과는 달리 엉뚱한 방향으로 가고 있다고 생각되면, 자신들이 잘못되었으니 다시 생각해보자고 하기보다는 나머지 세상 사람들이 잘못되었다고 말할 가능성이 더 크다고 전한다. 이와 함께 최고의 벤처를 가능하게 하는 공격성, 오만함, 제국 건설의 야심, 아주 뛰어난 시스템 기술과 같은 특성은 그들이 세상의 지배자가 될 때 큰 문제가 될 수 있다고 우려한다. 다소 과하다. 제국이 되어가는, 거대한 인터넷 생태계 자체가 되어버린 구글, 페이스북에 대해 감시의 눈을 더 날카롭게 뜨는 것은 중요하지만, 그렇다고 해서 인상 비평으로 넘어가는 것은 곤란하다. 구글이 CIA와 함께 미래 예측용 인터넷 실시간 데이터 수집 툴을 개발하는 Recorded Future 라는 회사에 투자했다는 사실 만으로 "데이터 권력 통합 자체만으로 우려할만하다"는 것은 조금 이른 감이 없지 않다. (음..책 읽을 때와 또 지금은 생각이 바뀐다. 이거 위험하다고 미리 경고할만 한건가?)

저자는 이 두 기업이 알고리즘 프로세스를 기업 비밀이라는 이유로 숨기는 것에 대해서도 인터넷의 개방성을 무시한 처사라고 비판하고 있지만, 나 스스로 인터넷 기업에 몸담고 있는 탓에 반론하지 않을 수 없다. 검색 생태계에서는 첫 화면에, 더 앞에 검색되기 위한 치열한 어뷰징이 끊이지 않는다. 알고리즘을 공개하는 것은 무한 어뷰징 정글로 만들 우려가 분명 있다.  알고리즘 필터 버블의 함정을 피해가면서, 그 안에 갖히지 않고서 살아가는 것도 어렵지만, 알고리즘을 이용하고자 하는 다양한 의도들이 중첩되는 상황은 어떻게 해결할 것인가.

(엘리 프레이저. 나보다 어린 것으로 아는데... ㅋ)


스마트한 시대를 살아가기 위해서는, 이용자가 스마트해질 수 밖에 없다고, 안그러면 눈 뜨고 코 베인다고, 똑같은 잔소리로 돌아가야 할까. 자기정보통제권에 대한 고민은 시간이 갈수록 깊어진다. 필립 딕 원작의 '마이너리티 리포트'에서 보여준 음울한 미래는 일부 이미 현실이다. 이 친근한 세상을 어찌하란 말인가.


Trackbacks 0 : Comments 1
  1. 2011.09.26 13:20 Modify/Delete Reply

    비밀댓글입니다

Write a comment