Tech

페이스북은 인공지능이 1인칭 인생관을 갖도록 돕는다.

피우미치노 2021. 10. 18. 09:00

페이스북이 이끄는 장기 인공지능 연구 프로젝트는 "내가 그것을 어디에 두었을까?"라는 영원한 질문에 대답하는 것을 도울 수 있을 것이다.

Ego4D 프로젝트는 AI가 "에고 중심적인" 1인칭 관점에서 세상을 이해하는 것을 목표로 한다. 증강현실(AR) 안경과 같은 기기의 효용성을 향상시키는 것이 희망이다. 예를 들어 키를 어디에 두었는지 기억하는 등의 작업을 지원할 수 있습니다. 페이스북은 블로그에 올린 글에서 "차세대 인공지능은 행동의 중심에서 세상을 보여주는 비디오로부터 배울 필요가 있을 것"이라고 주장한다. 이러한 "전자 중심적 관점"으로 세상을 이해하는 AI는 AR 안경이나 가상현실 헤드셋과 같은 "모험적 장치"가 스마트폰만큼 유용해지도록 도울 수 있다고 회사측은 말한다. 페이스북은 헤드셋 제조업체인 오큘러스의 소유권을 통해 VR에 대한 오랜 관심을 가져왔다. 그리고 그 회사는 최근 BBC에 그것들이 아직 개발 중이라고 말하면서 완전한 AR 안경들을 출시할 것으로 예상된다.

 

Ego4D는 "대규모 자기중심 비디오 데이터 세트"를 수집하여 사용자가 1인칭 관점에서 세상과 상호작용할 수 있도록 돕는 컴퓨터 비전 및 AI 시스템 개발을 지원하기 위한 협력적 노력이다.

이 프로젝트는 9개국에 걸쳐 13개 대학과 연구소로 구성된 컨소시엄을 포함한다.연구진은 데이터셋에는 "855명의 고유 카메라 착용자가 촬영한 수백 개의 시나리오(가계, 야외, 직장, 여가 등)에 걸친 3,025시간의 일상 활동 비디오"가 포함되어 있다고 말했다. 현재 컴퓨터 비전 알고리즘은 3인칭 관점에서 캡처된 이미지 및 비디오의 대규모 데이터 세트를 사용하여 훈련된다. "차세대 AI 시스템은 전혀 다른 종류의 데이터, 즉 세상을 옆에서가 아닌 행동 중심에서 보여주는 비디오로부터 배울 필요가 있습니다."라고 페이스북의 수석 연구 과학자 Kristen Grauman은 말했다. 페이스북이 주장하는 데이터셋은 11월부터 데이터 이용 계약에 서명한 연구자들이 이용할 수 있게 된다.

 

이 회사는 또한 보다 유용한 AI 어시스턴트를 개발하기 위해 5개의 "벤치마크 과제"를 개발했다. 페이스북은 다음과 같이 말했다.

- 언제 무슨 일이 있었어요? (예: "내가 열쇠를 어디에 두고 왔지?")

- 다음에는 어떻게 해야 할까요? (예: "잠깐, 이 요리법에 소금을 이미 추가하셨습니다.")

- 내가 무엇을하고 있는 거죠? (예: "드럼 치는 법을 가르쳐 주세요")

- 누가 뭐랬어? (예: "수업 중 주요 주제는 무엇이었습니까?")

- 누가 누구와 교류하고 있는가? (예: "이 시끄러운 식당에서 그 사람이 나에게 말하는 것을 더 잘 들을 수 있도록 도와주세요.")

 

하지만 페이스북은 때때로 연구원들과 마찰을 빚어왔다. 사생활에 대한 기록으로 심한 비난을 받고 벌금을 물었던 한 회사가 우리 삶에 대해 그렇게 친밀한 "1인칭"의 시각을 가진 기술을 개발하기를 원한다는 생각 또한 일부 사람들에게 영향을 미칠 것이다. 새로운 Ray-Ban Stories 카메라 유리는 훨씬 더 제한된 기술에도 불구하고 사생활에 대한 의문을 불러일으켰다.

기술 뉴스 사이트 The Verge는 "이 Ego4D 프로젝트의 벤치마크에는 눈에 띄는 개인 정보 보호 장치가 포함되어 있지 않다."라고 우려했다. 페이스북은 그러한 안전장치가 어플리케이션이 개발됨에 따라 시행될 것이라고 발표했다.