공급망에 숨겨진
Rest of World의 조사에 따르면 데이터 라벨링 플랫폼 Appen을 통해 고용되어 일상적인 주석 작업(이미지의 물체 식별, 오디오 전사, 텍스트 분류)을 수행하던 아프리카 전역의 긱 워커들이 미국 군부가 사용하는 AI 시스템에 무심코 기여하고 있었다. 시간당 몇 달러만 받는 많은 워커들은 자신의 노동이 국방 및 정보 애플리케이션으로 유입되고 있다는 사실을 몰랐다.
이 폭로는 AI 공급망의 문제적 측면을 드러낸다. 기계학습 시스템 훈련에 필수적인 인간 주석자들의 광대한 인력은 자신의 작업이 궁극적으로 어떻게 사용되는지에 대해 의도적으로 정보를 받지 못한다. 데이터 라벨링을 하는 사람들과 결과적인 AI 시스템을 배포하는 조직 간의 단절은 정보에 기반한 동의, 노동 관행, 그리고 군사 기술의 숨겨진 인간 인프라에 관한 심각한 윤리적 질문을 제기한다.
군부를 위한 데이터 라벨링이 어떻게 작동하는가
현대 AI 시스템, 특히 이미지 인식, 자연어 처리, 의사 결정 지원에 사용되는 시스템은 엄청난 양의 라벨링된 훈련 데이터가 필요하다. 누군가는 수천 개의 위성 이미지를 보고 차량 주위에 상자를 그려야 한다. 누군가는 수 시간의 오디오를 듣고 자신이 듣는 것을 전사해야 한다. 누군가는 텍스트를 읽고 주제, 감정, 또는 의도별로 분류해야 한다.
이 작업은 일반적으로 중개자 체인을 통해 외주된다. 방위사업체는 AI 시스템 개발을 위해 기술회사를 고용할 수 있다. 그 회사는 데이터 라벨링을 Appen과 같은 플랫폼에 재하청할 수 있으며, 이 플랫폼은 이 일을 미국이나 유럽의 노동 비용의 극히 일부인 국가의 많은 프리랜서들을 포함하여 전 세계의 프리랜서들에게 배분한다.
이 체인의 각 단계에서 데이터의 최종 사용 목적은 더욱 모호해진다. 피라미드 하단의 긱 워커들은 개별 작업을 본다 - 이 이미지에 라벨을 붙여라, 이 오디오 클립을 전사해라 - 자신이 도움을 주고 있는 더 광범위한 시스템에 대한 맥락 없이. Appen의 서비스 약관과 비공개 동의서는 종종 워커들이 최종 클라이언트의 신원은 물론이고, 자신의 작업이 지원하는 애플리케이션을 알지 못하도록 금지한다.
워커들이 라벨링한 것
조사에 따르면 아프리카의 긱 워커들은 군사 AI 애플리케이션으로 알려진 것과 일치하는 다양한 주석 작업을 수행하고 있었다. 여기에는 항공 및 위성 이미지에서 물체를 식별하고 분류하는 것이 포함되었다 - 군사 감시 및 표적 지정 시스템의 중심이 되는 기능. 워커들은 또한 통신 데이터 전사 및 분류, 그리고 매핑 이미지에서 지리공간 특징에 라벨을 붙이는 작업에 관여했다.
Rest of World와 인터뷰한 워커들 중 누구도 자신의 작업이 군사 또는 정보 애플리케이션과 연결되어 있다는 사실을 알려받지 못했다. 여러 명이 자신의 노동의 최종 용도를 알게 되었을 때 충격과 불편함을 표현했으며, 일부는 이 사실을 알았다면 그 일을 받아들이지 않았을 것이라고 말했다.
윤리적 함의는 지정학적 맥락을 고려할 때 특히 중요하다. 일부 워커들은 미국 군사 작전을 경험하거나 미국 외교 정책과 복잡한 관계를 가진 국가를 기반으로 한다. 자신의 노동이 자신의 지역사회와 유사한 지역으로 향하는 군사 능력에 기여할 수 있다는 생각은 인터뷰한 여러 워커들에게 깊은 우려를 안겨주었다.
- 아프리카의 긱 워커들이 Appen을 통해 고용되어 미국 군사 AI 시스템으로 유입된 데이터에 라벨을 붙였다
- 워커들은 서방 임금의 극히 일부만 받았으며 군사 용도에 대한 지식이 없었다
- 다층적 하청 구조는 데이터 라벨링 작업의 최종 애플리케이션을 의도적으로 워커들로부터 숨긴다
- 워커들은 자신의 노동이 어떻게 사용되고 있는지 알게 되었을 때 충격과 불편함을 표현했다
AI 공급망에서 Appen의 역할
호주 회사인 Appen은 한때 세계에서 가장 큰 데이터 주석 플랫폼 중 하나였으며, AI 공급망에서 중요한 중개자로서 오랫동안 역할을 해왔다. 이 회사는 피크 시절에 100만 명 이상의 계약자 글로벌 인력을 유지했으며, 기술 회사, 정부 기관, 방위사업체에 라벨링된 데이터를 제공했다.
데이터 라벨링 산업이 더욱 경쟁이 심해지고 일부 AI 회사들이 주석 작업을 내부로 옮기면서 회사는 최근 몇 년간 재정적 어려움을 겪었다. 그러나 국방 및 정보 클라이언트와의 역사적 계약은 글로벌 인력에 의해 라벨링된 상당한 양의 데이터가 이미 군사 AI 시스템에 통합되었음을 의미한다.
Appen의 옹호자들은 회사가 법률 범위 내에서 작동하며, 클라이언트와의 계약에는 데이터 보안 및 기밀성에 대한 적절한 조항이 포함되어 있다고 주장한다. 비평가들은 워커들이 자신이 무엇을 하고 있는지 알지 못하도록 하는 기밀성 조항은 특히 군사 애플리케이션과 관련된 작업의 경우 본질적으로 착취적이라고 반박한다.
보이지 않는 노동의 윤리
조사는 AI 산업의 더 광범위한 윤리적 과제를 강조한다. 기술 부문은 AI 시스템 뒤의 인간 노동을 보이지 않게 만드는 데 매우 효과적이었다. 군사 AI 시스템이 위성 이미지에서 목표를 올바르게 식별할 때, 신용은 알고리즘과 이를 설계한 엔지니어들에게 간다. 시스템을 가능하게 만든 수천 명의 인간 주석자들의 노동은 거의 인정받지 못하며, 더욱이 시스템이 어떻게 사용되는지에 대해 상의받지 못한다.
노동권 옹호자들은 AI 공급망에서 더 큰 투명성을 요구했으며, 데이터 라벨링 워커들이 자신의 작업이 지원하는 일반적인 애플리케이션 범주에 대해 정보를 받도록 하는 요구사항을 포함한다. 일부는 AI 훈련 데이터가 정보에 기반한 워커 동의와 함께 윤리적 노동 조건에서 생산되었는지를 확인하는 공정무역 라벨과 유사한 인증 제도를 제안했다.
AI 거버넌스의 함의
폭로는 또한 AI 규제에 관한 성장하는 국제 논쟁에 함의를 갖는다. 정부들이 AI 시스템 규제 프레임워크를 개발하면서, 훈련 데이터가 어떻게 조달되고 라벨링되는지에 대한 질문은 알고리즘 편향과 안전 테스트 같은 문제에 비해 상대적으로 적은 주의를 받았다.
무지한 외국 노동을 사용하여 군사 AI 시스템을 훈련시키는 것은 AI 거버넌스에 대한 국제 협상에서 뜨거운 쟁점이 될 수 있으며, 특히 개발도상국들이 글로벌 AI 경제에서 자신들의 역할에 대한 더 큰 인정과 더 큰 이익을 추진함에 따라 그럴 수 있다. AI를 가능하게 만드는 워커들이 자신들이 무엇을 만들고 있는지도 모른다면, AI 산업의 기초는 문제적인 도덕적 비대칭에 놓여 있다.
자신의 작업의 진정한 성격을 발견한 아프리카의 긱 워커들에게, 이 경험은 글로벌 AI 경제가 자신들의 노동에 의존하지만 그 노동이 어떻게 사용되는지에 대한 결정에 자신들을 포함할 의무를 느끼지 않는다는 증가하는 인식을 분명히 했다.
이 기사는 Rest of World의 보도에 기반합니다. 원문 기사를 읽으십시오.

