얘기

안나의 아카이브(Anna’s Archive) 알아보기

이범재 2026. 2. 6. 17:06

https://en.wikipedia.org/wiki/Anna%27s_Archive#/media/File:Annasarchivehome_1.15.25.png

 

 

'안나의 아카이브'

 

인류 역사상 가장 큰 오픈 라이브러리라고 자처하며 1.1PB(페타바이트) 규모의 책과 논문을 손쉽게 다운로드할 수 있는 검색 엔진 사이트

 

유명한 해적 사이트인 z-lib(전자책, 교재 등), sci-hub(학술 논문) 등에서 공유되고 있는 자료들을 안나의 아카이브에서 한눈에 볼 수 있습니다.

 

학술계의 구글인 셈이죠

 

물론 불법인데, 직접 파일을 호스팅 하거나 다운로드를 제공하는 사이트는 아니다 보니 법적으로는 "검색만 해주었을 뿐이다"라는 입장을 유지하고 있는데요

 

미국이 이런 주장을 받아들일 리는 없고 worldcat, spotify에게 소송을 당한 결과는 당연하게도 패소.

 

해적 사이트는 운영자의 신원이 밝혀지지 않다 보니 직접적인 피해를 입힐 순 없으나 법적인 의미로서 숨통을 조여가는 중이라고 합니다

 

https://finance.yahoo.com/news/nvidia-accused-trying-cut-deal-104241763.html?guccounter=1

 

Nvidia accused of trying to cut a deal with Anna’s Archive for high‑speed access to the massive pirated book haul — allege

Court documents appear to show Nvidia management green lit the deal, despite Anna’s Archive’s warnings.

www.tomshardware.com

 

한 달 전에 재밌는 뉴스가 떴는데, 안나 아카이브가 엔비디아와 접점이 있었다는 내용. 자사 llm 모델에 안나의 아카이브 자료를 활용하려 했다는 모양입니다

 

뭐 크롤링도 아니고 엔비디아의 data strategy team 직원이 직접 연락을 취했다는 주장인데, 안나의 아카이브는 암호화폐 후원을 통해 고속 다운로드가 가능해서 이와 관련해서 조건을 논의하는 메일을 보냈다고 하네요

 

이후 안나 아카이브 운영자가 reddit에서 공식 입장을 내놓았습니다

 

“We’ve never dealt with Nvidia directly, so they likely used an intermediate party to avoid legal issues. But if Nvidia were to contact us directly, we’d happily provide them with high speed access in exchange for a donation, same as we do with anyone else.”

 

그러니까 직접적인 연락은 받은 적 없고 법망을 피하기 위해 중개인을 통해 접근했을 수 있다는 건데요 하여튼 저 방대한 자료를 llm 학습에 활용할 수 있다면 군침을 흘릴 기업이 한두 곳이 아닐 거 같습니다

 

구글 ceo가 이런 말을 했었습니다

https://www.chosun.com/economy/tech_it/2024/08/05/UKY2DLLBEZBC5KVDLOSX7Z7RCU/

 

ai 발전 투자가 과열되고 있는 지금, 효율을 추구하는 기업 입장에서 안나 아카이브에 접근하지 않는 것은 길을 빙 돌아가는 일일지도 모르겠습니다

 

다들 뒤로는 이미 접근하고 있을 지도 모르죠

 

안나의 아카이브에 대해 간단히 알아보았는데요 저작권은 보호되어야만 하는 것이고 불법 사이트를 옹호할 수도 없지만 도서관에서 빌릴 수 없는 책에도 쉽게 접근할 수 있다는 점은 참 달콤하게 느껴지기도 하는 거 같습니다

(달콤하면 뭐해 책을 안 읽는데)