독서

데이터는 어떻게 세상을 지배하는가 -강성호 (발췌본)

러브블로썸 2024. 10. 14. 17:29

 

1. 거대한 변화(데이터가 창조하는 새로운 세상)

 

p39 “로빈후드가 수수료를 받지 않는 비결은 돈대신 데이터를 받기 때문이다. 로빈후드가 가져가는 데이터는 고객들이 주식을 사고팔 때 만들어지는 주문 데이터다.”

 

p42 “플랫폼 기업은 돈 대신 데이터를 벌고 있다. 플랫폼은 돈의 관점에서는 적자이지만 데이터 측면에서는 엄청난 흑자 기업이다. , 플랫폼 기업의 주가는 돈의 관점이 아니라 데이터=주가라는 관점에서 설명되어야 한다. ”

 

p 46 “데이터는 사회의 권력도 재분배한다.”

소수의 권력자들 대신 데이터와 플랫폼이 사회의 권위와 영향력을 배분하게 된 것이다. 플랫폼이 사회적 권위를 배분한다는 사실은 플랫폼에 대한 민주적 통제의 필요성을 시사한다.”

 

p 48 무엇이든 쪼개기

데이터가 축적되면서 기업의 마케팅 전략이 초개인화되고 있음을 의미한다. 콘텐츠도 쪼개어 진다.상품도 쪼개어진다. 일자리도 쪼개어진다. 온디맨드 시대. 미래에는 쪼개기가 불가능해 보이던 것들도 쪼개어질지 모른다. 예컨대 유권자가 원한다면 정치권력도 쪼개어질 수 있다.

 

p 52 데이터로 세상을 이해하다

모든 것의 데이터화

구글은 책을 데이터화하기도 했다. 책에 등장하는 모든 단어의 빈도수를 세고, 가장 많이 등장하는 단어가 무엇인지를 수리적으로 분석했다는 뜻이다. 구글은 책에 자주 등장하는 핵심 키워드를 가려내고 이를 토대로 핵심 내용을 독자에게 전달한다.“

 

사람대신 데이터를 믿는 시대

데이터 경제에서는 지인(또는 정부)의 품질보증이 필요없다. 오히려 데이터가 축적되면서 신뢰가 형성된다. 더 많은 것들이 데이터화 될수록 데이터는 정부의 역할을 대체해 나갈 것이다.“

 

2. 사업전략(기업경영의 중심이 된 데이터)

쿠팡 vs 네이버

 

p 66 쿠팡의 물류 최적화

상품의 포장 과정에도 데이터를 활용한다.“

난이도 높은 신선식품 시장

효율적 재고 관리를 위해 데이터수집과 분석도구를 준비했다.“

 

뒤죽박죽 물류창고

랜덤 스토우 방식 : 짧은 동선으로 물건을 찾을 수 있음. “

p72 쿠팡은 물류 관리를 위해 데이터를 사용한다면 네이버는 데이터를 공유하는데 힘을 쏟는다. 검색 데이터를 토대로 시장 트렌드를 분석하고, 물류 데이터를 소상공인에게 제공하는 플랫폼으로 진화하는 것이다.”

 

가격을 결정하다

p 76 “이처럼 가격을 정해놓지 않고 유동적으로 조절하는 전략을 다이내믹 프라이싱이라고 부른다.” 쿠팡이츠, 우버 등 쿠팡이츠는 이러한 라이더의 행동 데이터를 통해 배달의 난이도를 측정했다.”

다이내믹 프라이싱을 둘러싼 논란은 우리의 데이터가 어디까지 사용될 수 있는지에 대해 생각할 거리를 남긴다... 나의 데이터는 나를 위해 사용되기도 하지만 나를 위협하는 화살이 되기도 한다.”

 

손수 붙이는 태그

p91 “넷플릭스가 태그를 다는 이유는 영상의 세분화 때문이다. 넷플릭스가 사람의 수작업으로 영상을 분류한다. 태그는 메타데이터라고 불린다. 메타데이터란 그 자체가 최종적인 목적을 지닌 데이터가 아니라, 데이터를 분류하기 위해 데이터에 붙어있는 데이터를 지칭한다. 예컨대 인스타그램 사진에 붙어있는 해시태그도 메타데이터이다.”

메타데이터를 만드는 작업이 사람 손으로 이루어진다는 것은 데이터 시대에도 인간의 역할이 남아있음을 보여준다. ”

 

p93 “이 사실은 데이터 시대에도 인간과 컴퓨터의 공존이 가능하다는 것을 시사한다. 많은 일이 데이터와 AI에 의해 대체되고 있지만 여전히 인간의 창의력, 유연성, 그리고 전체를 꿰뚫어보는 통찰력은 한동안 대체되지 못하는 영역으로 남아있을 가능성이 크다.”

 

3. 지배력확보(데이터를 장악하기 위한 인수합병)

빅테크 기업과 헬스케어

p106 “구글에는 새로운 혁신기술만 연구하는 자회사도 있는데 바로 엑스라는 조직이다. 이제 헬스케어 산업은 누가 더 정교한 데이터를 수집하고 그 데이터를 분석할수있느냐로 경쟁하며 진화하고 있다.”

 

기업의 경쟁구도를 바꾸다

p 122 “플랫폼 기업들이 개인정보의 보호에 대해서는 경쟁 수준이 매우 낮다는 점이다. ”

 

시장지배력의 확대

p123 “자사우대 현상

 

 

4. AI의 위력: 처음 경험하는 혁신

고양이와 개 구분하기

p131 코너부분을 집중적으로 비교하는 SIFT 기술 -> 딥러닝기술 : 무수한 사진데이터를 토대로 AI가 알아서 사진의 패턴을 발견하도록 설계 + CNN기술 (이미지를 사전에 과장하거나 단순화하는 작업)

 

언어를 구사하는 AI

P142 “딥러닝은 인간이 이미 작성한 텍스트 데이터를 바탕으로 단어 간의 상관관계를 알아낸다.” “GPT는 단어 간의 패턴을 파악하기 위해 트랜스포머라는 모델을 사용한다. 동일한 단어라고 해도 문장 내에서 그 위치에 따라 숫자를 다르게 부여하는 방식이다.”

 

 

가짜데이터가 필요하다

p149 합성데이터의 미래 전망

 

p 158 규제와 개발의 갈림길

유럽에서는 AI규제법이 2024년 유럽의회에서 통과되었다. 이 법은 AI의 위험성을 4단계로 구분하고 위험성이 높은 AI에는 더 강한 규제를 부여하는 것을 골자로 삼는다.”

 

앞으로 한국에서도 AI와 관련한 규제를 어떻게 만들어 갈지 관심있게 지켜볼 필요가 있다.”

 

 

AI 시대를 맞이하는 한국의 과제

p161 AI의 산업 생태계

“AI 생태계를 가장 아래에서 지탱하는 산업은 다름 아닌 반도체다. 메모리반도체(한국), GPU(엔비디아) 클라우드 서비스도 AI생태계의 주요 구성요소이다.” “개발한 AI모델을 사람들이 사용할 수 있는 앱으로 확장하는 것도 새로운 산업으로 부상하고 있다.”

 

 

5. 국경파괴(데이터 주권과 패권 경쟁)

 

데이터 주권의 등장

P 173 “데이터 주권론은 국가 안보와도 쉽게 결합된다.”

한국정부의 지도 반출 불허 결정은 네이버, 카카오 등의 토종 플랫폼에 유리하게 작용했다... 데이터 장벽을 쌓고 자국의 데이터를 지키면 토종 산업을 육성할 수 있음을 보여준 사례다.”

데이터 주권론은 디지털시대에 새롭게 등장한 국내 산업 보호론이기도 하다.”

 

P199 “클라우드법미국기업이 해외에 데이터를 보관하더라도 수사기관에 이를 제공해야할 의무가 있음.

 

EU, 규제의 글로벌 스탠더드를 만들다

P202 “EU는 데이터 통제의 권한을 데이터의 본래 주인인 각 개인에게 부여한다. ”

 

 

 

6. 정보거래 : 데이터도 사고팔 수 있을까

 

P235 데이터 가격의 결정

데이터 가격결정 방법

 

P255 데이터 결합을 위해 우선적인 과제는 각 데이터 보유자의 인센티브를 조정하는 일이다.

 

P258 흩어진 데이터를 하나로 모아 주는 비즈니스를 마이데이터 사업이라고 부른다.

 

 

7. 새로운 성공: 데이터가 바꾸는 성공의 법칙

 

AI를 개발하는 사이언티스트 : 데이터사이언티스트

 

문과는 살아남을 수 있을까?

빅데이터가 심화될수록 문과출신을 비롯해 인간에게 유리한 일자리가 대거 만들어질듯하다.

첫째, 인간이 사고하는 방식때문

P275 빅데이터는 상관관계에 기반하고 있다. 인과관계를 찾아내는 장치가 아니다. , 빅데이터는 결론은 내지만 왜 그런 결론에 도달했는지에 대한 그럴듯한 스토리는 제시하지 못한다.

둘째, 인간은 중대한 결정일수록 기계와 소통하기 싫어한다.

 

새로운 제도를 만들고 이를 운영하는 것도 문과의 역할이다.

데이터 공급자로서 역할을 문과가 수행한다.

 

데이터가 바꾼 성공의 법칙

P289 애자일 조직, 린스타트업의 유행은 개인의 성공측면에서도 많은 것을 시사한다. 바로 실패의 비용이 낮아진 세계에서는 이것저것 일을 많이 벌여야 성공으로 이어질 확률도 높아진다. 이를 다른 말로 표현하면 행운을 찾아가는 행위라 할 수 있다. 성공이 확률에 의해 결정된다면 시도가 많아질수록 확률은 올라갈 수 밖에 없다.

 

 

스노우플레이크: 데이터 솔루션 기업, 기업이 데이터를 수집, 처리하는 과정을 도와준다. 높은 호환성

데이터브릭스: 머신러닝

 

8. 미래의 향방 : 데이터시대가 우리에게 던지는 과제

 

P 305 “데이터 거버넌스

데이터 부족 그 자체보다 기업이 데이터를 수집, 관리할 수 있는 역량을 갖추라고 주문한다.

 

데이터 민주화와 데이터 메시

데이터의 세금화

데이터로부터의 자유

 

 

데이터를 어떻게 규제할까

P323 “리쿠나비 사건: 개인정보의 범위가 어디까지인지, 또 기업은 제공받은 개인정보를 어디까지 활용할 수 있을지 고민하게 만든다.” 또한, 데이터 보호의 적정수준이 어느정도인지 고민해 보아야 한다.

 

 

저자의 결론 : 데이터가 만들어내는 혜택이 모든사람에게 공평하게 분배되는 사회를 만드는 것이 필요하다.