해커의 상태에 대한 대화
증강 현실(AR)을 실험하고 싶어하는 해커 커뮤니티에는 많은 사람들이 있지만, 하드웨어 환경은 우리의 목표와 우선 순위에 맞는 옵션이 넘쳐나지 않습니다. Google Glass부터 Microsoft HoloLens 및 Magic Leap 2에 이르는 상용 제품은 주로 의료 및 항공우주 고객을 대상으로 하며 그에 맞는 가격표가 있습니다. 예산 스펙트럼의 애호가 측면에는 표준 스마트폰에 장착할 수 있는 다양한 헤드셋이 남아 있지만 가상 현실(VR)과 마찬가지로 특수 목적 장비와는 거의 비교할 수 없습니다.
하지만 희망은 있습니다. Brilliant Labs는 모든 조건을 충족하는 AR 장치를 개발하고 있습니다. 저렴하고 인터페이스가 쉬우며 무엇보다도 처음부터 최대한 개방적으로 개발되었습니다. 확실히 그들의 첫 번째 제품인 Monocle은 Big Players가 제공하는 제품에 비해 다소 단순합니다. 하지만 돈을 생각하면 해킹하고 실험할 수 있도록 만들어진 것을 선호합니다. 공식 SDK를 직접 사용해 볼 수도 없는데 모든 최신 기능이 무슨 소용이 있겠습니까?
이번 주 우리는 Brilliant Lab의 엔지니어링 책임자인 Raj Nakaraja를 Hack Chat에 초대하여 독점 하드웨어와 소프트웨어가 지배하는 이 분야에서 AR, Monocle 및 오픈 소스의 미래에 대해 이야기했습니다.
당연히 채팅은 모노클이 어떻게 작동하는지, 특히 모노클을 착용했을 때 정확히 어떻게 보이는지에 대한 질문으로 시작되었습니다. 전체 시야를 고해상도 그래픽으로 채우려는 다른 장치와 비교하여 Monocle은 사용자 눈 앞에 배치된 빔 스플리터를 통해 빛을 비추는 작은 Sony ECX336CN 640 x 400 OLED를 사용합니다. 최종 결과는 Raj가 시야 중심에서 몇도 아래에 앉아 "팔 길이의 태블릿 화면"처럼 보이는 경험이라고 설명합니다. Monocle에 있는 내용을 보는 것은 상당히 자연스러운 일입니다. 마치 영화를 보다가 휴대폰을 보기 위해 아래를 내려다보는 것과 비슷합니다.
상업용 제품의 경우 Monocle의 문서는 매우 뛰어납니다. 우리가 구입한 모든 하드웨어에 이런 종류의 정보가 함께 제공되는 세상은 우리가 꿈꿀 수 밖에 없었습니다. 회로도와 3D 모델을 사용할 수 있으며, 소프트웨어 측면에 대한 광범위한 지침이 제공되어 자신만의 OTA(무선) 업그레이드를 만드는 방법을 설명합니다.
즉, 실제로 모노클을 직접 제작하기는 어려울 것입니다. Raj는 제조 측면이 상당히 어려웠으며 실제로 필요한 광학 제품을 생산할 수 있는 파트너를 찾는 데 시간이 걸렸다고 말했습니다. 여러 개의 사출 성형 광학 부품은 특수 광학 접착제를 사용하여 자체 및 OLED 자체에 접착되어야 합니다. Brilliant Labs는 Monocle의 이 부분에 대해 특허를 가지고 있지만 Raj는 이것이 주로 특허 괴물을 막기 위한 것이라고 말하며 채팅에 참여하는 사람들에게 해당 작업에 대해 더 자세히 읽고 싶은지 확인하도록 초대했습니다.
작은 크기에도 불구하고 Monocle에는 그래픽 가속을 제공하는 데 사용되는 FPGA를 포함하여 인상적인 양의 하드웨어가 포함되어 있습니다. 이러한 모든 구성 요소는 상당한 양의 에너지를 소비하며 내장된 전원 관리 기능을 사용하더라도 장치의 내부 70mAh 배터리는 지금까지만 사용할 수 있습니다.
Raj는 일반적인 사용 시 Monocle에서 약 45분의 실행 시간을 얻을 수 있으며, 5 MP Omnivision OV5640 카메라를 사용하여 녹화하는 경우 대략 절반 정도를 얻을 수 있다고 말합니다. 좋은 점은 모노클에는 장치를 6번 충전할 수 있는 충분한 용량의 충전 케이스가 함께 제공된다는 것입니다.
하드웨어 세부 사항은 제쳐두고 채팅의 몇몇 사람들은 해커가 AR로 현실적으로 어떤 일을 할 수 있는지 물었습니다. 당연히 여기에는 약간의 상상력이 필요한 곳입니다. 하지만 적어도 Monocle의 경우 모든 소프트웨어는 기본적으로 Python이므로 원하는 대로 연결하기가 매우 쉽습니다. Raj는 Monocle을 ChatGPT에 연결한 한 사용자와 같은 몇 가지 예를 지적합니다. 장치는 사용자에게 말하는 내용을 듣고 이를 언어 모델에 입력하고 은밀하게 디스플레이에 적절한 응답을 표시합니다. 분명히 그것은 엉뚱한 프로젝트였지만 약간만 수정하면 일종의 보편적인 번역기로 사용될 수 있습니다.