close_btn
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

[미디어산업과 저널리즘] 로봇 저널리즘(강정수_연세대커뮤니케이션연소)_정리+필사

+본문 첨부함

 

통계원숭이stats Monkey의 진화

프로야구에서의 최종승자 7차전,경기진행상황을 속보로 전하는 기자들은 경기종류 후 진행감독 선수들을 미리 인터뷰하고 이들과의 인터뷰를 통해서, 승부의 장면 장면을 뉴스로 생산한다. 미국에서의 움직임은 현실임을 알려준다. 미국 온라인 콘텐츠 회사 오토메이티드 인사이츠는 초당 9.5개에 달하는 기사를 생산하는 속도로 2013년 총 3억개에 달하는 기사를 생산했고 월평균 로봇은 1 5천개의 기사를 미국 주요 언론사에 판매한다. 내러티브 사이언스(Narrative Science)는 한발 더 나아가, 스포츠기사뿐만 아닌 경제전문 미디어기업 포브스Forbes에 알고리즘 이후 금융기사를 판매한다. 또한 영국 가디언Guardian은 지난 2013 11월부터 종이신문을 사람이아닌 알고리즘으로 생산하는 프로젝트를 시행중이다. 길지만 좋은 읽을거리 The long good read라는 이름의 알로기르젬의해 자동생산되는 시문은, 가디언, 뉴스사이트를 통해 긴 기사를 댓글,소셜공유 등으로 선별하여 자동 편집하는 24쪽 타블로이드 판형의 인쇄종이신문이다. 사람 편집을 거치지않는 최초 종이신문인 것이다. 알고리즘에 기반한 자동기사생산은 종이신문,디지털뉴스2013년을 통과하며 영미권을 중심으로 빠른 속도로 퍼져나가는 중이다. 로봇 저널리즘 또는 알고리즘 저널리즘의 첫 번째 단계로서 편집국 보조수단이 발전했다. 예컨데 로스앤젤레스 타임즈는 로스앤젤레스와 그 주변 지역의 발생 지진관련 정보를 자동으로 수집-정리하여 사실확인을 위한 퀘이크봇(quakebot)이란 소프트웨어가 활용되는 중이다. 이는 기사가 특정 뉴스를 제작하는 보조수단으로서의 소프트웨어가 지금까지 작성된 뉴스를 요약하고 노구치 자료를 글로 전환하고 글에 어울리는 도표와 이미지를 제안하는 일을 담당한다. 유튜브에서 자막자동생성기능처럼 소프트웨어는 정치인들 국회연설등이 자동으로 글을 전환하고 해당정치인의 과거자료와 빠른 비교분석이 가능해진다. 즉 알고리즘의 저널리즘 1)빠른 속도로 생산되는 막대한양의 적지 않은 뉴스사이트는 구글 애널리틱스를 분석도구로 활용한다. 그러나 날로 진화하는 구글 애널리틱스Google Analytics의 데이터를 정리하고 매일 요약보고서를 만드는게 결코 쉬운일이 아니다. 내러티브 사이언스(Narrative Sdience) 2014년 퀼 인게이지(Quill Engage)를 선보이는데 쿠리인게이지는 구글애널리틱스 자료를 통해 매일 간략한 보고서를 자동생산한다. 이와같은 데이터 분류와 요약기술은 저널리즘에 제한되지않고 데이터분석data mining의 일반기술이다. 이런 맥락에서의 미국 중앙정보국(CIA)의 데이터분류 및 요약기술을 통해 내러티브 사이언스(Narrative Science)에 간접적 투자이유를 알 수 있다.

알고리즘저널리즘 두번째 단계는 수집된 데이터와 정보에 기초한 소프트웨어의 의미를 해석하고 스스로 기사생성을 진행하는 것이다. 최종 발행 결정,전체 과정의 감독,해당 알고리즘 생산에의한 인간노동이 필요하다. 두번째 단계는 기사생성 자동화 수준(the level of the automatic technology)에서의 진정한 의미의 알고리즘 저널리즘이라 할 수 있다.

이런 알고리즘에 기반한 기사자동생산의 역사는 2009 4월 미국 노스웨스턴대학 저널리즘과 컴퓨터 공학과 학생 4명으로부터 시작된다. 이들은 4명이 한 수업에서 조별연구과제를 제출하고 작성하기위해 뭉친 팀원이었다 .당시 그들에게 주어진 협업연구과제는 디지털 뉴스시장 확대에 따라 지역언론사가 겪는 문제가 무엇인지 정의하고 그 해결책을 제시하는것이었다. 점점 더 많은 사람들이 종이매체가 아닌 온라인에서 정보를 얻는다. 독자의 이동경로에서의 전통적 미디어기업들도 종이매체를 인터넷으로 옮겨가며 새로운 수익을 만들어내야 한다는 쉽지 않은 과제를 맞닥뜨리고 있다. 특히 미국내 지역언론사는 구인,구직,중고차매매 부동산 매매등에의한, 안내광고가 온라인으로 옮겨감에의한 재정적 어려움를 겪는다. 한편 기자들 역시 마감시간이 따로 없이 계속 터지는 이슈와 사건을 속보로 전해야하는 온라인 뉴스생산방식에 힘겹게 적응중이다. 기자들의 단순 노동을 줄여 그들이 좀 더 가치있는 일에 집중하도록 하자는데에 학생들은 뜻을 모은다. 이런 배경에서 개발된 스태츠 멍키stats monkey란 이름의 알고리즘은 지역리그 야구경기에대한 뉴스를 자동으로 생산하는 기능을 갖는다. 기자들은 스태츠 멍키를 활용해 매일매일 진해오디는 야구경기를 요약하는 기사생산을 컴퓨터 대신 분석,기사와 인터뷰 등에 보다 깊이 있게, 기사생산에 집중 할 수 있는 시간적 여유를 갖게 된 것이다. 스태츠 멍키는 크게 두 가지 기술요소로 구성요소가 있다. 월드와이드웹에서의 경기,관련된 정보를 실시간 수집하고 의사결정나무 학습알고리즘에의해 분류되며 그 결과가 제작된 기본 문장이 입력되고 이런 방식으로 단 몇 초 만에 야구경기기사를 완성한다. 데이터베이스에서 텍스트를 자동 생산하는 스태츠멍키(States Monkey)의 진화기술은 진화를 거듭하며 내러티브 사이언스(Narrative Science)라는 기업탄생에 이어진다.

 


<
중략>

지식의 의미변화(the transformation to definition of Knowledge)

스태츠 멍키 등 기사생산 알고리즘은 인간 이야기를 전하는 독특한 방식과 이야기에 주장과 감정을 담아내는 능력은 없다.  스태츠 멍키를 통해 시작된 알고리즘 기술진화는 데이터를 수집하고 주어진 규칙에의한 데이터에 의미를 부여하고 다양한 정보를 종합적으로 판단하여 지식생산을 자동시키는 수준까지 발전하고 있다 데이빗 웨인버거(David Weinbergr) 2012년 지나치게 많아서 알 수 없는 (too big to know)에서 도서관,과학 학술지 등에서 지식을 얻는 익숙한 방법은 축소를 통한 지식획득(knowing by reducing)이다. 이와 다른 거대하고 서로 연결된 웹에서의 지식을 포함하는 과정은 knowing including이다. 포함하는 지식은 과거 축소지시고가 다르다. 과학지식이 달라지고 경제지식이변화하고 교육지식이 바뀌고 정부에게 있어 지식은 과거의 그것이 아니고 우리 모두에게 과거의 지식은 오늘의 지식과 다르다고 주장하는 것이다. 웨인버거가 내세우는 달라진 지식개념을 이해하기에 지식은 전통적인 지식은 무엇인지,데이터 및 정보와 지식은 서로 어떻게 구별되는지 알아야 한다. 지식은 고대 그리스에서도 등장하는 매우 오래된 개념이다 .반면 정보는 20세기 중반 이후 비로소 널리 사용되는 개념이다. 역사적으로 서로 다른 맥락에서 형성된 지식과 정보라는 두 개념은 어떤 수준에서 상호보완관계를 이루며 어떤 점에서 서로 충돌할것인가.정보란 개념은 컴퓨터 시스템이 발전하며 널리 사용되왔다. 그러나 정보를 몇 개의 단어 또는 문장으로 저으이 혹은 설명하는게 쉽지 않다. 때론 컴퓨터 시스템에서 흐르는 데이터,인간,컴퓨터 사이에 오고가는 정보를 데이터라고 부른다. 정보는 특정한 사실,상황에 의해 전달되거나 혹은 수신하는 지식을 말한다. 정보를 뜻하는 자료(데이터)라고 생각하는 의견도 많으나 이런 분야에서의 컾뮤터,정보처리에서는 전체적인 정보의 뜻을 갖고 문제 삼는 경우가 별로 없으며 특히 정보와 자료는 구별되지 않는다. 구분한다면 데이터를 모아둔 것이 자료라면 자료를 특정 목적의 의사결정을 위해 가공한 형태를 정보라 한다. 1.관찰이나 측정을 통한 수집자료를 실제 문제에 도움되게끔 정리한 지식, 그자료 2)군사에서의 일차적으로 수집한 첩보를 통해 분석,평가하여 얻은 실정 혹은 구체적 자료 3)컴퓨터나 어떤 자료나 소식을 통해 얻는 지식이나 상태의 촐얄,정보원천에서 발생하는 구체적 양,정보량을 측정하는 것. 자동화 부분을 통한 응용언어학에서도 사용된다.그러나 지금까지의 정보 및 지식에 대한 개념정의의 정보와 지식의 차이성에 기초해서 지식생산의 자동화와 지식개념의 변화를 이해하는건 쉽지 않다. 정보와 지식개념에 대한 보다 체계적 구별이 필요한 것이다. 한편 지식을 경험 또는 교육을 통해 얻는 사실,정보,그리고 능력으로 정의한다. 이와 같은 정보 및 지식에 대한 개념의 정의와 정보와 지식의 차이성에 기반한 지식생산의 자동화 및 지식개념의 변화를 이해하기 쉽지않다. 즉 정보와 지식에 대한 보다 체계적인 구별이 필요한 것이다.

 

정보 : 형식,내용 그리고 효과의 삼원체계(information : formation,contents and effection,effectiveness)

정보는 형식,의미 그리고 효과란 세 개 의 항목(triad)로 구성된다. (aamodt and Nygard 1995, 196쪽 이하)형식,내용 및 효과는 기호학의 개념으로서는 각각 구문론 syntax 의미론 semantics 그리고 화용론 pragmatics와 조응한다. 구성요소는 다시 말해 구문론 측면에서 정보는 기호 sign과 문자 chracters 숫자numerals등의 결합이다. 이미지 또는 음성신호 또한 정보로 분류 가능하다. 여기에서 이미지의 구분은 선 또는 점이고 음성신호의 구분은 서로 다른 음의 음량 volume 이고 진동수frequency. 구문은 인간 또는 컴퓨터시스템에 어떤 유용성도 없단 점에서(the point that the each different volume of sounds and system’s different mechanism has no worthy word for it’s system) 의미semantics와 구별된다 기호의 묶음은 이미지에 부여되고 인간의 해석이 더해진 결과물 또는 그것에 대한 의미 semantics로 불린다. 특정 기호의 결합체 syntax에서 단일한 의미가 추출 되는게 아니라 서로 다른 의미가 부여된단 것이다. 데이터를 해석하거나 주어진 데이터로부터 어떤 의미를 찾는 과정은 논리적 사고, 경험그리고 주어진 다른 정보를 필요로 하기 때문이다. 또한 주어진 기호 묶음(the collection of given symbol to the cabinet)또는 데이터로부터(or from data) 100퍼센트 정확한(100% accurate) 그리고 누구나 동의하는 해석은 불가능하다.(100% be totally agreeable agenda is not impossible) 따라서 동일한 기호묶음에 대한 서로 다른 해석의 가능성과 그로 인한 갈등 잠재력은 semantics가 전달체로서의 구문syntax을 필요로 하는 속성으로 인해 불가피하다.

예컨데 11/06이란 정보를 가정할 경우 구문은 네 개의 숫자와 한 개의 사선으로 구성된다. 11/06에 대한 해석이 단일하지 않다. 11/06은 미국식 날짜형식 또는 독일식 날짜형식의 변형일 수 있다. 한편 11.06은 호텔방번호로 해석될 수도 있다. 11/06과 관련된 문맥(context)가 주어질때에만 비로소 11/06 11 6일로 이해하는 것이다. 이처럼 의미론은 주어진 문맥을 고려한 기호로부터의 해석된 결과물이나 다름없다. 즉 기호 또는 데이터는 본질적으로 구문론의 성격을 갖고 있고 기호 또는 데이터에 대한 해석이 정보다. 정보는 해석된 데이터다. 따라서 데이터는 현실태고, 정보는 다양한 해석 가능성으로 인해 상황적 성격을 갖는다. 이렇게 데이터/구문론과 정보/의미론이 뚜렷하게 구분된다는 것은 정보란 개념을 이해함에 있어서 매우 중요하다.

정보개념과 관련하여 추가적으로 살펴야하는 것은 화용론과 효과다. 구문에서는 의미가 만들어지나 정보는 그 자체로서 유용성을 갖지 못한다. 다시 말해 그 무언가를 연쇄작용으로 일으킬 때 정보는 비로소 유용성을 만들어낸다. 효과는 정보가 갖는 의미가 발신자로부터 수신자에게 정확하게 전달될때만 만들어진다. 바로 정보가 효과 또는 발신자의 반응을 가능하게한다는 점에서 정보는 데이터,사실,지표등과 구별된다. 구문,의미,효과의 관계를 컴퓨터 네트워크에서 정보를 전달하는 OSI모형(Open Systems interconnection Reference Model)으로 설명하자면 발신자는 수신자가 특정한 행위,화용론을 수용하길 원한다. 이를 위해 발신자는 특정한 행위에 의미를 부여하지만 의미론,의미는 특정형식으로 표현-구문론이 되어야 한다. 이러한 특정 형식은 발신자로부터 수신자에게로의 전달되고 이후 재구성 및 재구조화 과정이 일어난다 수신자는 구문론 계층에서 데이터를 받고 여기에 의미를 부여한다. 의미론, 그리고 수신자는 발신자가 희망한 행위를 수행한다. 화용론,정보는 형식에 의미가 부여되고 이로부터 효과가 일어날때 탄생한다. 이렇게 정보는 형식,의미,그리고 효과라는 세 가지 항목triad 로 구성된다. 그렇다면 정보는 달리 지식과 어떻게 정의 가능한가. 먼저 플라톤은 테아이테토스Theaitetos)에서 지식이 진실되고 정당함이 인정된 의견(justiced true belief)라고 정의한다. 진실하고 의견 모두가 지식이 되는 것은 또한 아니다. 예언능력을 가진 사람들이 다음주 미래에 있을 로또에 대한 6가지 숫자에 대한 진실한 의견을 가질 수 있따. 그러나 이는 다음주 미래,로또 숫자에대한 지식이 되기 어렵다. 어떤 사람이 방송 또는 인터넷에서 로또 숫자를 경험하고 그 경험 출처를 밝힐 수 있다면 로또 숫자는 지식이 된다. 이런 플라톤의 지식에 대한 정의는 이후 수많은 철학자들에의해 수용되고 이에 기초하여 지식은 단순의견,믿음과 구별된다. 그러나 플라톤은 정보와 지식을 뚜렷하게 구별 않고 플라톤의 지식개념에는 정보와 지식관계를 추론할 여지가 담긴다. 그는 지식필요조건으로 정당화 다시 말해 근거 및 참조를 제시한다. 지식에 대한 근거를 제공하는 복수의 정보가 지식의 필요조건임을 플라톤은 강조하는것이다.

 따라서 형식,내용 및 의미 그리고 효과를 포함하는 정보가 없을시에 정보는 혹은 지식은 존재하기 어렵다. 아모트와 나이가드(Aemodt and Nygard 1995)는 지식은 복수의 그리고 서로관계를 맺는 정보들의 합성이다. 지식은 인간이 정보를 관계화하고 정보를 분류화하고 정보를 해석하고 이해하는 과정을 통해 만들어진다. 정보로 만들어진 지식으로부터의 인간은 적절한 결정을 내리고 이를 통해 특정 행위를 수행한다. 이뿐만 아니라 지식은 새로운 지식의 탄생을 가능하게한다. 나아가 지식은 형식을 갖고 저장되는 과정을 거쳐 다시 정보로 전환된다. 고로 정보는 타 주체-사람, 그리고 컴퓨터시스템-에의해 전달되고 타 주체와 소통되기 위한 기호로 부호화 encoding화되고 타주체에의해 복수화 decoding과정 그리고 이후 해석되고 배열되는 과정을 거쳐 다시 정보로 전환되고 지식으로 구성된다.

다양한 정보를 처리하는 과정에서 발생하는 지식은 인공지능 전문가인 아모트와 나이가드에 의하면 온전히 인간의 이성을 통해서만 가능하다. 컴퓨터 시스템을 통해 정보를 이해하고 연결하는 수준은 아직까지 의미있는 행동이 유발되거나 새로운 지식이 탄생하는 정도까지 발생하지 못한다. 특히 컴퓨터 시스템은 행동에대한 책임을 짊어지지않는다는 점에서 인간과 다르다. 그러나 20년 전 일반적으로 수용된 정보 및 지식생산에 있어서(about production to knowledge by accumuulated and accepted information in generally) 인간과 컴퓨터 시스템의 뚜렷한 역할구분은 여전히 타당한가. 스태츠 멍키에의해 생산되 기사는 인간에게 가공을 위해 제공되는 정보 혹은 근거인가 아니면 기사에 담긴 내용은 그 자체로서 새로운 지식인가.

 

기술도약의 순간들

에릭 브린욜프슨(Eric Bryjolfsson)과 앤드루 매카피(Andres McAffee) 2011 <기계와의 경쟁_Race Aganist the Machine)와 그리고 2013년 하반기 출판된 제2의 기계시대 The Second Machine Age에서 진화되는 알고리즘 및 로봇기술이 노동사회의 근본질서를 변화시키고 있음을 밝힌다.이 두 저술에 드러나 저자의 다소 가벼운 기술낙관주의를 공감하기가 쉽지 않다. 그리나 브린욜프슨과 매카피가 제2의 산업혁명 여명이 어떻게 밝아오는지를 규명하는 부분이 매우 흥미롭다. 디지털 기술은 우리가 생산하는 것보다 빠른 속도로 기술일반을 보다 효율적으로 저렴하게 만든다. 캡차 Capcha가 과제를 완벽하게 풀어내는 구글 스트리트뷰 기술이 구글 무인운전Self Driving CAr을 가능하게한 결정적 요소다. 연관영역에서 독립적으로 진해오디는 디지털 기술진화는 어느 수간 갑작스런 기술도약을 만들어낸다. 브린욜프슨과 매카피는 기술도약 순간이 찾아오면 인간은 더 이상 기계를 대상으로 하는 경쟁력을 상실한다. 로봇 저널리즘은 그 자체로 기술연구에 의해 진화하나 연관기술인 신경망 분석neutral network 심층학습deep learning등의 기술진화에 직접적인 영향을 받는다. 또한 영국의 BBC의 구조화된 데이터Structrued data 실험,링크드 데이터 Lniked Data등과같이 영역에서 진화하는 기술에 의한 로봇저널리즘은 예상치 못한 기술도약의 순간을 만들어낸다. 어쩌면 로봇 저널리즘 또는 알고리즘 저널리즘은 기계에서 인간의 마지막 성역으로 존재한 지식생산의 자리를 내주는 첫 번째 신호일 것이다.

 

 


List of Articles
번호 제목 글쓴이 날짜 조회 수
15 [저널리즘] 발터 벤야민의 사유에 나타난 주체, 이미지, 기술 사이의 관계_김현강_인문논총(2013)_논문필사,정리 file WalkerhoduJ 2016.07.07 297
14 저널리즘_기호학] 몸-코드와 이데올로기(Body-Frame, Codeideology) _김광현_2010_한국기호학회_논문 필사,어휘정리 file WalkerhoduJ 2016.07.04 275
13 ​[미디어오늘] 201604 관심 기사 스크랩 WalkerhoduJ 2016.05.02 255
12 [저널리즘]디지털 기술발전과 미디어 콘텐츠산업 WalkerhoduJ 2016.04.20 784
11 [저널리즘] 디지털콘텐츠의 이해_메모_콘텐츠 비즈니스메니지먼트 수업자료 중 WalkerhoduJ 2016.04.20 427
10 [미디어산업] 허핑턴 포스트_ the Huffington post_케이스스터디 WalkerhoduJ 2016.04.20 90
9 [미디어산업] 허핑턴 포스트_ the Huffington post_케이스스터디 WalkerhoduJ 2016.04.20 245
8 [Journalism] A vision for the future of the media Industry_Avideverywhere_transcription_summary file WalkerhoduJ 2016.03.07 2049
7 [Journalism] From Media History to zeitkritik_Wolfgang Ernst_Humboldt University.Germany file WalkerhoduJ 2016.03.07 428
6 [저널리즘]미디어와 인간의 확장_이남표(2002+10월)_정리페이퍼-필사(공부용)_이남표(2002.10) WalkerhoduJ 2016.01.12 442
» [미디어산업과 저널리즘] 로봇 저널리즘(강정수_연세대커뮤니케이션연소)_정리+필사 WalkerhoduJ 2016.01.12 243
4 [저널리즘]미디어 기술의 발전과 인간 커뮤니케이션: -마샬 맥루한의 기술결정론적 관점에서- WalkerhoduJ 2016.01.12 697
3 [COGITO] 20511221 초연결사회(Hyper Connected Society)의 도래와 미디어매체 이용자의 자아정체성 형성과정과 특징 file WalkerhoduJ 2016.01.12 283
2 [저널리즘] Understanding Mass Media and the Importance of Media Literacy WalkerhoduJ 2015.10.18 2287
1 [논문] 뉴욕타임스 혁신보고서(원문포함)_소개 file WalkerhoduJ 2015.10.12 421
Board Pagination Prev 1 2 Next
/ 2