2024. 5. 28. 00:24ㆍ게시판
AI 내러티브의 첫 번째 관점: 산업 공급 측면에서 AI 뒤의 에너지 및 데이터 추적 기회 살펴보기
산업 공급 측면에서 AI 개발의 네 가지 원동력은 다음과 같습니다.
· 알고리즘: 고품질 알고리즘은 교육 및 추론 작업을 보다 효율적으로 수행할 수 있습니다.
· 컴퓨팅 성능: 모델 훈련과 모델 추론 모두 컴퓨팅 성능을 제공하기 위해 GPU 하드웨어가 필요하며, 이는 현재 업계의 주요 병목 현상이기도 합니다. 업계의 칩 부족으로 인해 중급 및 고급 칩 가격이 높아졌습니다.
· 에너지 : AI가 요구하는 데이터 컴퓨팅 센터는 많은 에너지를 소비하게 된다. GPU 자체가 컴퓨팅 작업을 수행하는 데 필요한 전력 외에도 GPU 열 방출을 처리하는 데에도 많은 에너지가 필요합니다. 대규모 데이터센터의 냉각 시스템은 전체 에너지 소비량의 약 40%를 차지한다.
· 데이터: 대규모 모델의 성능을 향상하려면 훈련 매개변수 확장이 필요하며 이는 고품질 데이터에 대한 엄청난 수요를 의미합니다.
위 4개 산업의 원동력 중 알고리즘 및 컴퓨팅 파워 트랙에서는 유통 시장 가치가 10억 달러 이상인 암호화폐 프로젝트가 있는 반면, 에너지 및 데이터 트랙에서는 동일한 시장 가치를 가진 프로젝트가 없습니다. .
실제로 에너지와 데이터의 공급 부족이 곧 다가와 업계의 새로운 핫스팟이 되어 암호화폐 관련 프로젝트의 붐을 일으킬 수 있습니다.
먼저 에너지에 대해 이야기해보자.
머스크는 2024년 2월 29일 보쉬 커넥티드 월드 2024 컨퍼런스에서 "1년여 전부터 칩 부족을 예상했는데 다음 부족은 전기가 될 것"이라고 말했다. 년도."
구체적인 데이터 중 페이페이 리(Fei-Fei Li)가 이끄는 스탠포드대학교 인간중심인공지능연구소(Human-Centered Artificial Intelligence Institute)는 매년 AI 지수 보고서를 발표하고 있다. 연구팀은 2022년 발표한 2021년 AI 산업 보고서에서 해당 연도 AI의 에너지 소비량이 전 세계 전력 수요의 0.9%에 불과해 에너지와 환경에 대한 압력이 제한적일 것으로 추정했다. . 국제에너지기구(IEA)는 2023년 2022년을 다음과 같이 요약했다. 글로벌 데이터센터는 약 460테라와트시(TWh)의 전력을 소비해 전 세계 전력 수요의 2%를 차지하며, 2026년에는 글로벌 데이터센터가 에너지 소비량은 최소 620TWh, 최대 1,050TWh입니다.
실제로 IEA의 추정은 여전히 보수적이다. 이미 AI 관련 프로젝트가 많이 착수될 예정이고, 그에 따른 에너지 수요 규모도 23년 상상을 훨씬 뛰어넘기 때문이다.
예를 들어 Microsoft와 OpenAI가 계획하고 있는 Stargate 프로젝트가 있습니다. 이 프로젝트는 2028년에 시작되어 2030년쯤 완료될 것으로 예상됩니다. 이 프로젝트는 OpenAI에 전례 없는 컴퓨팅 성능을 제공하여 인공 지능, 특히 대규모 언어 모델에 대한 연구 개발을 지원하기 위해 수백만 개의 전용 AI 칩을 갖춘 슈퍼컴퓨터를 구축할 계획입니다. 이번 계획에는 현재 대형 데이터센터 비용의 100배에 달하는 1000억 달러 이상의 비용이 들 것으로 예상된다.
그리고 Stargate 프로젝트의 에너지 소비량만 해도 50테라와트시나 됩니다.
오픈AI(OpenAI) 창업자인 샘 알트먼(Sam Altman)이 올해 1월 다보스 포럼에서 “인공지능이 소비하는 전력은 사람들의 기대를 훨씬 뛰어넘기 때문에 미래에는 에너지 혁신이 필요하다”고 말한 것도 바로 이 때문이다.
빠르게 성장하는 AI 산업에서 컴퓨팅 파워와 에너지 다음으로 부족한 분야는 데이터일 가능성이 높다.
즉, AI가 요구하는 고품질 데이터의 부족이 현실이 된 것이다.
현재 인간은 기본적으로 GPT의 진화를 통해 대규모 언어 모델 기능의 성장 법칙을 파악했습니다. 즉, 모델 매개변수와 학습 데이터를 확장하면 모델의 기능이 기하급수적으로 향상될 수 있으며 여기에는 기술적 병목 현상이 없습니다. 단기적으로 프로세스를 수행합니다.
하지만 문제는 고품질의 공공 데이터가 앞으로 점점 더 부족해질 수 있고, AI 제품도 칩이나 에너지와 마찬가지로 데이터 수급 모순에 직면할 수 있다는 점이다.
첫째, 데이터 소유권에 대한 분쟁이 증가했습니다.
2023년 12월 27일, The New York Times는 OpenAI와 Microsoft를 미국 연방 지방 법원에 공식적으로 고소하면서 GPT 모델을 훈련하기 위한 허가 없이 수백만 개의 기사를 사용했다고 비난했습니다. 고유한 가치를 지닌 저작물의 불법 복사 및 사용"을 금지하고 The New York Times의 저작권 자료가 포함된 모든 모델 및 교육 데이터를 파기합니다.
3월 말 뉴욕타임스는 OpenAI뿐만 아니라 Google, Meta를 겨냥한 새로운 성명을 발표했습니다. New York Times의 성명에 따르면 OpenAI는 Whisper라는 음성 인식 도구를 통해 수많은 YouTube 동영상의 음성 부분을 기록한 다음 텍스트를 텍스트로 생성하여 GPT-4를 훈련했다고 밝혔습니다. 뉴욕타임스는 이제 대기업이 AI 모델을 훈련할 때 사소한 절도를 사용하는 것이 매우 흔한 일이라며 구글도 이런 일을 하고 있다고 전했다. 그들은 또한 자체 대형 모델의 훈련을 위해 YouTube 비디오 콘텐츠를 텍스트로 변환하는데, 이는 본질적으로 비디오 콘텐츠 제작자의 권리를 침해하는 것입니다.
뉴욕타임스와 오픈AI는 '최초의 AI 저작권 사건'인만큼 사건 내용의 복잡성과 콘텐츠 미래 및 AI 산업에 미치는 광범위한 영향을 고려할 때 빠른 결론에 도달하지 못할 수도 있다. 가능한 최종 결과 중 하나는 양측이 법정 밖에서 화해하고, 부유한 마이크로소프트와 오픈AI가 거액의 배상금을 지불하는 것이다. 그러나 앞으로 더 많은 데이터 저작권 마찰로 인해 고품질 데이터의 전반적인 비용이 높아질 것입니다.
또, 세계 최대 검색 엔진인 구글이 검색 기능에 대한 유료화를 검토하고 있다고도 밝혔는데, 그 대상은 일반 대중이 아닌 AI 기업이다.

출처: 로이터
Google의 검색 엔진 서버는 많은 양의 콘텐츠를 저장합니다. Google은 21세기 이후 인터넷 페이지에 등장한 모든 콘텐츠를 저장한다고 할 수도 있습니다. 현재 해외의 펄렉시티, 중국의 키미·미타 등 AI 기반 검색 제품은 검색된 데이터를 AI로 가공해 사용자에게 출력한다. AI 검색엔진의 요금은 필연적으로 데이터 획득 비용을 증가시킨다.
실제로 AI 대기업들은 공개 데이터 외에도 비공개 내부 데이터에도 주목하고 있습니다.

Photobucket은 2000년대 초반에 7천만 명의 사용자와 미국 온라인 사진 시장 점유율의 거의 절반을 차지한 오랜 역사를 지닌 사진 및 비디오 호스팅 웹 사이트입니다. 소셜 미디어의 등장으로 포토버킷 사용자 수가 크게 줄어들었고, 현재 활성 사용자는 200만 명밖에 남지 않았습니다(연간 399달러라는 높은 수수료를 지불해야 함). 사용자가 등록 시 서명한 계약 및 개인정보 보호정책에 따라 1년 이상 사용하지 않은 계정은 재활용되며, Photobucket은 사용자가 업로드한 사진 및 동영상 데이터에 대한 사용 권한도 지원합니다. Photobucket CEO인 Ted Leonard는 자사가 소유한 13억 장의 사진과 비디오 데이터가 생성 AI 모델을 훈련하는 데 매우 중요하다고 밝혔습니다. 그는 이 데이터를 판매하기 위해 여러 기술 회사와 협상 중이며 가격은 사진당 5센트에서 1달러, 비디오당 1달러 이상입니다. 그는 Photobucket이 제공할 수 있는 데이터의 가치가 10억 달러 이상일 것으로 추정합니다.
인공지능 발전 동향을 연구하는 연구팀인 EPOCH는 머신러닝에 필요한 데이터에 대한 보고서 "우리는 데이터가 고갈될 것인가? 머신러닝에서 데이터셋 스케일링의 한계에 대한 분석"을 발표했습니다. 2022년 머신러닝에서의 데이터 활용과 신규 데이터 생성, 컴퓨팅 자원의 성장 등을 고려하고 있습니다. 보고서는 2023년 2월부터 2026년까지 고품질 텍스트 데이터가 고갈되고, 2030년부터 2060년 사이에 이미지 데이터가 고갈될 것으로 결론 내렸다. 대규모 데이터 세트에 의존하는 대규모 기계 학습 모델은 속도가 느려질 수 있습니다.
그리고 AI 거대 기업들이 데이터를 높은 가격에 구매하고 있는 현재 상황으로 볼 때, 무료로 제공되는 고품질 텍스트 데이터는 사실상 고갈된 상태이며, 2년 전 EPOCH의 예측은 비교적 정확했습니다.
동시에 'AI 데이터 부족'에 대한 수요에 대한 솔루션, 즉 AI 데이터 제공 서비스도 등장하고 있습니다.
Defined.ai는 AI 기업에 맞춤형, 실제 고품질 데이터를 제공하는 회사입니다.

Defined.ai가 제공할 수 있는 데이터 유형의 예: https://www.defined.ai/datasets
비즈니스 모델은 다음과 같습니다. AI 회사는 Defined.ai에 자체 데이터 요구 사항을 제공합니다. 예를 들어, 사진의 경우 품질이 특정 해상도 이상이어야 하고, 흐릿함과 과다 노출을 피해야 하며, 콘텐츠가 진정성 있어야 합니다. 콘텐츠 측면에서는 AI 기업이 야간 사진, 콘, 주차장, 야간 간판 등 자체 훈련 과제에 따라 특정 테마를 맞춤화해 야간 장면에서 AI의 인식률을 높일 수 있다. 일반인들이 과제를 맡아 촬영한 후 업로드하면, 기업에서는 이를 검토한 뒤 사진 수에 따라 요건에 맞는 부분을 정산한다. 가격은 고화질이 1~2달러 정도이고, 10초 이상의 단편영화는 5~7달러, 10분 이상의 고화질은 100~300달러, 1편은 1~2달러 정도이다. 1000 단어의 텍스트에 대해 미국 달러입니다. 하도급 업무를 맡은 사람은 수수료의 20% 정도를 받을 수 있다. 데이터 제공은 "데이터 라벨링" 이후 또 다른 크라우드소싱 비즈니스가 될 수 있습니다.
글로벌 크라우드소싱 작업 분배, 경제적 인센티브, 가격 책정, 데이터 자산의 유통 및 개인 정보 보호 등 누구나 참여할 수 있다는 점은 Web3 패러다임에 특히 적합한 비즈니스 카테고리처럼 들립니다.
산업 공급 측면의 관점에서 본 AI 내러티브 타겟
칩 부족으로 인한 관심은 암호화폐 산업까지 침투하여 분산 컴퓨팅 성능을 지금까지 가장 인기 있고 가치 있는 AI 트랙 카테고리로 만들었습니다.
AI 산업에서 에너지와 데이터의 수급 모순이 향후 1~2년 내에 발생한다면, 현재 암호화폐 산업에서는 어떤 서사 관련 프로젝트가 진행되고 있나요?
먼저 에너지 목표를 살펴보겠습니다.
상위 CEX에서 시작된 에너지 프로젝트는 거의 없으며 Power Ledger(token Powr)는 단 하나뿐입니다.
파워렛저는 2017년에 설립되었습니다. 블록체인 기술을 기반으로 한 종합 에너지 플랫폼입니다. 이는 에너지 거래의 분산화를 달성하고, 개인과 공동체 간의 직접적인 전기 거래를 촉진하며, 재생 가능 에너지의 광범위한 적용을 지원하고, 스마트 계약을 통해 거래의 투명성과 효율성을 보장하는 것을 목표로 합니다. 처음에 Power Ledger는 Ethereum에서 변형된 Alliance Chain에서 운영되었습니다. 2023년 하반기에 Power Ledger는 백서를 업데이트하고 솔라나의 기술 프레임워크를 기반으로 분산 에너지 시장에서 고주파 소액 거래를 처리하는 데 편리한 자체 종합 퍼블릭 체인을 출시했습니다. 현재 Power Ledger의 주요 사업은 다음과 같습니다.
· 에너지 거래: 사용자가 P2P 방식으로 전기, 특히 재생 에너지에서 얻은 전기를 직접 사고 팔 수 있도록 합니다.
· 환경상품 거래 : 탄소배출권, 재생에너지 증서 거래, 환경상품 기반 금융 등.
· 퍼블릭 체인 운영: 애플리케이션 개발자를 유치하여 Powerledger 블록체인에 애플리케이션을 구축하고 퍼블릭 체인의 거래 수수료를 Powr 토큰으로 지불합니다.
Power Ledger 프로젝트의 현재 시장 가치는 1억 7천만 달러이며, 총 시장 가치는 3억 2천만 달러입니다.
에너지 관련 암호화폐에 비해 데이터 트랙의 암호화폐 수가 더 풍부합니다.
저자는 현재 관심을 갖고 CEX, Binance, OKX 및 Coinbase 중 하나 이상에서 출시된 데이터 추적 프로젝트만 나열하고 FDV에 따라 낮은 것부터 높은 것 순으로 정렬합니다.
1. 스트리머 – 데이터
Streamr의 가치 제안은 사용자가 자신의 데이터에 대한 완전한 통제권을 유지하면서 데이터를 자유롭게 거래하고 공유할 수 있도록 하는 분산형 실시간 데이터 네트워크를 구축하는 것입니다. Streamr는 데이터 시장을 통해 데이터 생산자가 중개자 없이 관심 있는 소비자에게 데이터 스트림을 직접 판매하여 비용을 절감하고 효율성을 향상시킬 수 있기를 희망합니다.

출처: https://streamr.network/hub/projects
실제 협력 사례에서 Streamr는 다른 Web3 차량 하드웨어 프로젝트인 DIMO와 협력하여 차량에 설치된 DIMO 하드웨어 센서를 통해 온도, 기압 및 기타 데이터를 수집하여 필요한 기관에 전송할 기상 데이터 스트림을 형성했습니다.
다른 데이터 프로젝트와 비교하여 Streamr는 사물 인터넷 및 하드웨어 센서의 데이터에 더 중점을 둡니다. 위에서 언급한 DIMO 차량 데이터 외에도 다른 프로젝트에는 헬싱키의 실시간 교통 데이터 스트림이 포함됩니다. 따라서 Streamr의 프로젝트 토큰 DATA도 Depin 컨셉이 가장 뜨거웠던 지난해 12월에 하루 두 배의 상승폭을 기록했습니다.
현재 Streamr 프로젝트의 순환 시장 가치는 4,400만 달러이며, 총 순환 시장 가치는 5,800만 달러입니다.
2. 공유결합 - CQT
다른 데이터 프로젝트와 달리 Covalent는 블록체인 데이터를 제공합니다. Covalent 네트워크는 RPC를 통해 블록체인 노드에서 데이터를 읽은 다음 데이터를 처리하고 구성하여 효율적인 쿼리 데이터베이스를 만듭니다. 이러한 방식으로 Covalent 사용자는 블록체인 노드에서 직접 복잡한 쿼리를 수행할 필요 없이 필요한 정보를 신속하게 검색할 수 있습니다. 이러한 유형의 서비스를 "블록체인 데이터 인덱싱"이라고도 합니다.
Covalent의 고객은 주로 다양한 Defi와 같은 Dapp 프로젝트와 Consensys(Metamask의 모회사), CoinGecko(유명 암호화폐 자산 시장 스테이션), Rotki(세금 도구), Rainbow와 같은 많은 중앙 집중식 암호화 회사를 포함한 B-side입니다. 이밖에도 전통 금융계의 거대 기업인 피델리티(Fidelity)와 빅4 회계법인 중 하나인 언스트앤영(Ernst & Young)도 코발렌스의 고객이다. Covalent가 공식적으로 공개한 데이터에 따르면, 해당 프로젝트의 데이터 서비스 수익은 동종 분야 선두 프로젝트인 The Graph를 넘어섰습니다.
온체인 데이터의 무결성, 개방성, 신뢰성 및 실시간 특성으로 인해 Web3 산업은 세분화된 AI 시나리오 및 특정 "AI 소형 모델"을 위한 고품질 데이터 소스가 될 것으로 예상됩니다. 데이터 제공자로서 Covalent는 다양한 AI 시나리오에 대한 데이터를 제공하기 시작했으며 AI를 위해 특별히 검증 가능한 구조화된 데이터를 출시했습니다.

예를 들어, AI를 사용하여 수익성 있는 거래 패턴과 주소를 식별하는 온체인 스마트 거래 플랫폼 SmartWhales에 데이터를 제공합니다. Entender Finance는 AI 처리를 통한 실시간 통찰력, 이상 탐지 및 예측 분석을 위해 Covalent의 구조화된 데이터를 사용합니다.
현재 Covalent가 제공하는 온체인 데이터 서비스의 주요 시나리오는 여전히 금융이 지배하고 있지만 Web3 제품 및 데이터 유형이 일반화됨에 따라 온체인 데이터의 사용 시나리오는 더욱 확대될 것입니다.
현재 Covalent 프로젝트의 순환 시장 가치는 1억 5천만 달러이고, 전체 순환 시장 가치는 2억 3,500만 달러입니다. 같은 트랙에 있는 블록체인 데이터 인덱스 프로젝트인 The Graph와 비교하면 상대적으로 분명한 가치 평가 우위를 가지고 있습니다.
3.Hivemapper - 꿀
모든 데이터 자료 중에서 비디오 데이터의 단가가 가장 높은 경우가 많습니다. Hivemapper는 AI 기업에 영상, 지도 정보 등의 데이터를 제공할 수 있습니다. Hivemapper 자체는 블록체인 기술과 커뮤니티 기여를 통해 상세하고 역동적이며 접근 가능한 지도 시스템을 만드는 것을 목표로 하는 분산형 글로벌 지도 프로젝트입니다. 참가자는 대시캠을 통해 지도 데이터를 캡처하여 오픈 소스 Hivemapper 데이터 네트워크에 추가하고 프로젝트 토큰 HONEY에 대한 기여도에 따라 보상을 받을 수 있습니다. 네트워크 효과를 높이고 상호 작용 비용을 줄이기 위해 Hivemapper는 Solana를 기반으로 구축되었습니다.
Hivemapper는 2015년에 처음 설립되었습니다. 원래 비전은 드론을 사용하여 지도를 만드는 것이었지만 나중에 이 모델의 확장이 어렵다는 사실을 알게 되자 대시캠과 스마트폰을 사용하여 지리 데이터를 캡처하여 글로벌 지도 제작 비용을 절감하게 되었습니다.
Google 지도와 같은 스트리트 뷰 및 지도 소프트웨어와 비교하여 Hivemapper는 인센티브 네트워크 및 크라우드소싱 모델을 통해 지도 범위를 보다 효율적으로 확장하고 지도 장면을 최신 상태로 유지하며 비디오 품질을 향상시킬 수 있습니다.
AI의 데이터 수요가 발생하기 전 Hivemapper의 주요 고객으로는 자동차 산업의 자율주행 부서, 내비게이션 서비스 회사, 정부, 보험 및 부동산 회사가 있었습니다. 오늘날 Hivemapper는 API를 통해 광범위한 도로 및 환경 데이터가 포함된 AI 및 대형 모델을 제공할 수 있습니다. 지속적으로 업데이트되는 이미지 및 도로 특징 데이터 스트림의 입력을 통해 AI 및 ML 모델은 데이터를 향상된 기능으로 더 효과적으로 변환하고 지리적 위치 및 시각적 판단과 관련된 작업을 수행할 수 있습니다.

현재 Hivemapper – Honey 프로젝트의 순환 시장 가치는 1억 2천만 달러이고, 전체 순환 시장 가치는 4억 9천 6백만 달러입니다.
위의 세 가지 프로젝트 외에도 데이터 트랙의 다른 프로젝트로는 Covalent와 유사한 사업을 갖고 블록체인 데이터 인덱싱 서비스도 제공하는 The Graph – GRT(유통 시장 가치 32억 달러, FDV 37억 달러)가 있습니다. 그리고 Ocean Protocol – OCEAN(유통 시장 가치 6억 7천만 달러, FDV 14억 5천만 달러, 이 프로젝트는 Fetch.ai 및 SingularityNET과 합병될 예정이며 토큰은 ASI로 변환될 예정), 교환을 용이하게 하기 위해 설계된 오픈 소스 프로토콜입니다. 데이터 및 데이터 관련 서비스의 수익화, 데이터 소비자와 데이터 제공자를 연결하여 신뢰, 투명성 및 추적성을 보장한다는 전제하에 데이터를 공유합니다.
코인올백 트위터
영희에게 코인 인증하고 코인올백 심화방 입장하기
|
'게시판' 카테고리의 다른 글
MT Capital 연구 보고서: DePIN은 물리적 인프라의 분산화된 미래를 재구성합니다 -(1) (0) | 2024.05.28 |
---|---|
암호화폐 AI 트랙의 차세대 내러티브 추론: 촉매 요인, 개발 경로 및 관련 목표 -(3) (0) | 2024.05.28 |
암호화폐 AI 트랙의 차세대 내러티브 추론: 촉매 요인, 개발 경로 및 관련 목표 -(1) (0) | 2024.05.28 |
갈등은 더욱 심화됐다. FT가 Base와 '해산'할 예정인가요? (0) | 2024.05.28 |
MOBOX의 새로운 게임 Dragonverse Neo가 블록체인 게임의 죽음의 나선에 도전하는 방법 (0) | 2024.05.28 |