우리는 AI가 인간처럼 움직이는 3D 세계를 볼 수 있도록 돕고 있습니다. D4RT를 입력하세요. 이전 방법보다 빠르게 비디오를 4D 표현으로 변환하여 공간과 시간을 이해할 수 있게 해주는 통합 모델입니다. 이것이 작동하는 방식입니다
4D 재구성은 동적 개체에서 실패하는 경우가 많아 잔상 현상이나 처리 지연이 발생합니다. D4RT는 이전 방법보다 18배~300배 빠르게 실행하면서 무엇이 움직이는지 지속적으로 이해할 수 있습니다. 단일 TPU 칩에서 약 5초 만에 1분짜리 비디오를 처리할 수 있습니다.
우리는 이 연구가 현실 세계에 무제한적으로 적용될 수 있다고 믿습니다. 로봇공학에서 공간 인식을 제공하고, AR에서 효율성을 높이고, 월드 모델에서 기능을 확장하는 것부터 D4RT의 잠재력은 AGI를 향한 길에서 필요한 단계입니다. 찾다

#뉴스 #트렌드
@GoogleDeepMind | 2026-01-23