ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 자율주행을 위한 데이터 파이프라인 구축 방법 대박
    카테고리 없음 2020. 3. 2. 14:38

    >


    이번에는 테스트 및 조사 차량에서 데이터를 수집하기 위한 어프로치와 프로세스 전체에 걸쳐서 데이터 요구를 충족시키기 위한 적절한 데이터 파이프 라인을 구축하는 비결을 탐구한다. ​, 자율 주행 도전 ​ 대부분의 큰 기업은 이미 Level 4자율 주행과 그 이상을 위한 토대로서 점점 정교한 운전자 지원 시스템(Advanced Driver Assistance System, ADAS)을 공급하고 있습니다.


    >


    자율주행차(AV) 개발 프로젝트는 상당한 데이터 과제에 직면해 있습니다. R&D를 위해 배치된 각 차량은 산과 같은 데이터를 발생합니다.현장에서 차로 데이터를 효율적으로 이동하여 심층 신경망(Deep Neural Networks, DNN)을 훈련할 수 있는 파이프라인을 어떻게 구축합니까?, DNN 학습을 위해 이미지 및 기타 센서 데이터 및 레이블(주석) 데이터를 효율적으로 준비합니까?신경망을 훈련시키는데 얼마나 힘들지 않고, 많은 스토리지와 컴퓨팅이 필요한가요? 학습 클러스터가 사내에서도 클라우드에 있어야 하는가?스토리지 요구 사항, 네트워크 대역폭, 컴퓨팅 용량을 시작으로 하는 데이터 파이프라인, 학습 클러스터에 맞는 인프라를 어떻게 올바르게 사이즈 설정해 있습니까? 고려해야 할 다른 데이터의 흐름은? 자율주행차의 개발을 위한 데이터 파이프라인 자율주행차의 개발 프로그램은, 각각 고유의 데이터 관리 요건을 가지는 많은 구성 요소를 가지고 있습니다. 데이터의 양과 다양성은 모든 영역에서 고유의 문재를 만듭니다. 이 절에서는 향후와 같은 다양한 핵심 영역에서 특정 데이터와 컴퓨팅 문재를 설명합니다.완전 센서 슈트(full sensor suites)가 장착된 테스트 차량의 데이터 수집 테스트 차량에서 파생된 라벨(Label) 데이터를 사용하여 DNN 학습 DNN의 성능을 테스트하고 추가 학습 데이터를 발생하기 위한 시뮬레이션 매핑으로 물리적 환경에 관한 자세한 모습의 발생 후 그림은 파이프라인 구성요소를 상위레벨로 요약한 것입니다.​


    >


    테스트 차량에서의 데이터 수집 데이터 수집 프로세스 동안 데이터는 fleet의 각 테스트 차량으로부터 수집되어야 하는 것이다. 차, 1대당 실제에 수집하는 데이터의 양은 센서 양복마다 다르죠.​ 가이드 라인은 초기 학습 때 때 테러단 하나~5TB의 테테로울 결심하고 실제 결과를 수신할 때 결심을 업데이트하세요.시험 차량의 데이터 수집은 2단계에서 과인됩니다.초기 학습(Initial training). 만약 당신이 졸음소음으로부터 DNN을 훈련시키고 있다면, 당신은 당신의 시험차량에서 모든 운전데이터를 수집해야 할 것입니다.·하달학습(Transfer training), 일단 여러분의 DNN이 잘 작동하기 시작하면 여러분은 시험차량이 잘 작동하지 않는 졸음안전기사가 통제하는 귀취로만 데이터를 수집할 필요가 있고, 또 과인 수집하기를 바랄 수 있습니다.특히 초기 학습 중에는 대역폭 제한과 비용 때문에 각 차량에서 데이터를 휴대 네트워크를 통해 전송할 수 없을 것 같습니다. 각 차량에 데이터를 저장하고 차가 차고와 와인 창고에 도달할 때 주기적으로 내려받는 현실성이 높습니다.그러기 위해서는 각 테스트차량과 차고위치 양쪽에서 데이터예기지의 인프라가 필요할 것이다. 데스트 파일이 다른 도시로 확장됨으로써 당신은 각 도시의 데이터를 집계하기 위해 허브 위치를 추가할 필요도 있습니다.데이터 집계 테스트 차에서 데이터를 수집할 때는 데이터센터과의 클라우드(역시 양쪽 모두)에서 데이터 레이크(Data Lake)로 집계하는 것이 일반적입니다. 데이터 레이크는 일반적으로 HDFS, 오브젝트 저장소도 파일 저장소를 사용해 Hadoop을 구축하는 형태를 취할 것이다.데이터 레이크가 부적절하게 실장되면 데이터가 축적되어 보틀넥 현상이 발생·활용될 수 있으므로, 이러한 세심한 고려를 하는 것이 중요할 것이다. 수집되는 데이터의 양을 위해 자율주행 개발 프로그램의 현재 모범예는 데이터 레이크와 훈련클러스터를 사내에 두는 것이며 어쩌면 이 프로젝트의 일부도 클라우드에 있을 수 있습니다.​ ​ 가이드 라인은 연간 테스토챠랴은당, 적어도 2PB의 데이터에 대한 생각의 수립 ​ 다르게 예기하면 시험, 자율 주행 자동차 하나 0대가 매년 최소 20PB의 데이터 레이크 용량을 결심하는 것이다. 가끔 시간이 지날수록 수집한 데이터의 상당 부분이 자주 접속되지 않을 수 있기 때문에 어떤 형태의 콜드 예상지도 기대할 수 있습니다.데이터레이블지정AV개발에서가장큰병목중하과인은라벨이부착된학습데이터의필요성일가능성이있습니다. 특히 초기학습 중에는 알고리즘이 자율주행 중에 잘 보이는 다양한 물체(다른 차량, 도로표시, 표지판, 곡선, 보행자, 자전거를 타는 사람 등)를 정확하게 식별할 수 있도록 수백만 개의 라벨 이미지가 필요할 수 있습니다.​도 하군 연간 시험 차당 2PB의 데이터를 예상하는 것이라면 그것은 약 하나 0억개의 볼 소지와 해석되며, 그 중 300만개 이상의 똔가에 라벨을 길러야 함도 있습니다. 이 분류는 여전히 사람에 의해 거의 이루어지고 있습니다.많은 중견 업체가 인부들을 사용해서 라벨을 표시할 것이다. 이것은 자주 세계의 다른 지역에서, 그러한 노동자가 필요한 데이터에 액세스 할 수 있도록 하는 것을 의미할 것이다. 라벨이 지정된 맹화에 대한 송신비용에도 불구하고 이를 달성하기 위해 데이터를 클라우드로 이동해야 할 수 있습니다.DNN 학습 자율 주행을 위한 DNN을 설계하는 단일 접근 방식은 없지만, 다양한 개별 작업을 하는 별도의 DNN이 있는 앙상블 접근 방식을 사용하는 것이 일반적입니다. 예를 들어 경로의 작정, 객체 식별, 판독기호, 정지 등의 상태 감지, 기타 기능을 위한 DNN이 있을 수 있습니다.사실 이는 여러분이 단순히 하과인 DNN을 훈련시키는 것이 아니라, 여러분은 각 사건의 등급에 대해 다른 접근방식을 포함해 여러 개의 DNN을 훈련시키고 정기적으로 그렇게 하는 현실성이 있다는 것을 의미할 것이다. 이것은 필요한 계산의 규모를 크게 증가시키기 위해 인지하는 것이 중요할 것이다.​ 디플러 닌 학습 클러스터에서 현재 기술의 그이츄 이은 스케일 아웃 클러스터에 잠재적으로 소보 댄 수백대와 4~8대의 GPU가 있는지가 있습니다. I/O의 관점에서, 노은 모든 GPU을 하나 00퍼센트 바쁘게 유지해야 할 것. 자네는 데이터를 기다리는 GPU를 유휴 상태로 방치하는 것을 피해야 할 것이다.NVIDIA DGX-하나 딥러닝 시스템은 8개의 NVIDIA GPU를 지원 CPU와 고성능 인터커넥트를 포함하고 있습니다. AV애플리케이션의 경우, 단일 DGX-하나 은 하루에 하그와잉의 DNN에 300K라벨 이제 일을 훈련시킬 수 있어요. 테스토챠랴은당 300만개의 라벨이 붙은 영상과 많은 실험이 병렬로 실행되어 하나 0개의 DNN이 있다고 가정하면 테스토챠랴은당 최대 하나 00개의 DGX-한가지 더 필요할지가 있습니다.​ 가이드 라인:DNN을 배우기 위한 테스토챠랴은당 하나 00대의 DGX·하나 시스템(역시는 그에 상응하는 시스템)에 대한 결심을 수립하세요.시뮬레이션/재시뮬레이션의 대부분의 AV 개발 프로그램에서 시뮬레이션은 프로세스의 중요한 구성 요소입니다. 시뮬레이션을 통해 DNN은 다양한 주행환경을 시뮬레이션하고 테스트 차량에서 수집된 실제 시과인리오를 재생하여 신속하게 테스트할 수 있습니다(그러한 시과인리오의 변형뿐만 아니라).시뮬레이션은 그 자체에 상당한 연구와 혁신의 영역입니다. 많은 중견기업이 특히 자율주행차와 로봇을 위한 현실적인 시뮬레이션에 초점을 맞추고 있습니다. 시뮬레이션의 성공에는 다양한 측면이 있습니다.필요한 해상도의 달성 및 모든 차량 센서에 대한 실제 입력 공급·연구 중인 DNN의 앙상블에 필요한 추론 성능 공급, 다양한 시뮬레이션 스트림이 병렬로 실행되는 현실성·차량, 자전거, 보행자 및 기타 모든 비 정차 요소의 정확한 모델링. ​ 3D, 매핑, 많은 AV프로그램의 역시 다른 중요한 요소는 고화질 3D매핑입니다. 많은 에이브이 접근 경로에서 고화질 지도를 이용할 것이다. 차양의 센서 어레이에서 기존 지도까지의 출력을 비교하는 것은 경로 작정 프로세스를 단순화하는 비결로 많은 사람에 의해 고려됩니다.만일 이것이 사용하고 싶은 방법이라면 가장 먼저 당신의 매핑을 할지, 다른 사람의 데이터에 의존하는지를 판정해야 할 것이다. 많은 신생 중견기업과 다른 중견기업들이 데이터 세트 매핑 작업을 하고 있습니다.과민하지 않은 만큼의 매핑을 하는 것은 경쟁적인 이점을 공급할 수 있고, 그것은 당신이 정한 센서 어레이와 보다 밀접하게 일치하지만, 상당한 추가 투자를 과인타는 HD지도를 만들 수 있게 해줍니다. 대상 지역에 맞는 고해상도 3D지도를 직접 만들 생각이라면 필요한 모든 곳에 매핑 데이터를 수집, 처리 및 공급하기 위해서 필요한 데이터와 파이프 라인을 수집하기 위해서 적절한 센서를 갖춘 조사의 차가 필요합니다. 매핑 프로세스는 프로그램이 확장될 때 new 영역으로 확장되어야 하고 지도는 정기적으로 고쳐 써야 합니다.끼어드는 자율주행차를 개발하는 입장에서 보면 가장 중요한 것은 아마도 오상에 예기한 데이터를 어떻게 잘 관리하는 것이 아닐까. 자율주행차량에 대한 뉴스를 접하면 자율주행에서 주행거리, 주행에서 얻을 수 있는 정보의 라벨 정의, AI를 위한 학습 등의 예를 들어봅니다. 그런 정보를 단발적으로 접하게 되면 무슨 소음인지 잘 이해하지 못하는 분들도 있을 겁니다. 이번 뉴스는 그런 정보를 간략하게 연결시키는 것이 아닌가 싶다.'결미 자율주행차'는 기술적인 이야기에서의 최종 목적은 사람을 대신하는 인공지능을 가진 로봇을 실현하는 것입니다. 이런 AI를 위해서는 사람이 성장하면서 학습하는 것처럼 AI에게도 학습과정을 거쳐 인간 수준이 될 수 있도록 하겠습니다. 사람도 많은 경험을 하며 그러한 경험의 적절한 조합으로 new귀취에 합리적인 판단을 할 수 있습니다. 자율주행차 AI도 합리적인 운전을 하려면 남들이 하는 것과 똑같은 경험을 하고, 그런 경험을 바탕으로 다음 운전을 할 때는 더 과인은 반응을 보여야 할 것이다. 사람은 스스로 경험하고 판단하는 단일 존재로 모든 것을 해결할 수 있지만, AI의 경우는 그러한 경험을 학습하기 위한 별도의 입력 장치의 Data가 필요할 것이다. 그런 이유로 자율주행차를 개발하는 중견기업들이 지속적으로 테스트 차량을 통해 많은 데이터 수집에 집중하고 있습니다.그러나 그렇게 수집된 데이터는 어떻게 활용할지는 자율주행차를 개발하는 중견기업에 달려 있지만 개별적으로 생성되는 테스트 차량의 데이터를 수집하고 정리하고 필요한 작업을 하려면 자율주행차를 개발하는 모든 사람들이 같은 정보를 공유해야 한다. 그러기 위해서는 데이터를 하한으로 모을 수 있는 저장소가 필요하고 어디서든 접근할 수 있는 클라우드가 공급되어야 한다. 이 글을 작성한 중견기업이 그런 제품을 공급하는 중견기업입니다.저도 가끔 자율주행차를 개발하는 중견기업이 AWS, Microsoft 같은 클라우드 서비스를 공급하는 중견기업과 협력한다는 소식을 전했습니다. Microsoft의 경우 신생 스타트업을 위해 무상으로 지원하는 프로그램도 진행되었습니다. 즉,이러한자율주행차의데이터를관리하는것은많은비용이필요한작업입니다. 작은 중견기업에서 쉽게 접근할 수 없음을 단적으로 보여줄 수도 있을 것이다. 이러한 이유, 최근 들어 많은 중견기업들은 과로가 아닌 이들이 데이터를 연구 목적 기관에 dataset을 공급하고 있습니다. 그리고 WEF의 경우에는 dataset 공유를 위한 프로젝트를 개시했습니다.자율주행차의 발전 방향이 어떻게 진행될지는 정확하게는 예상할 수 없습니다. 현재는 기술적 발전보다는 사회적 수용에 대해 더 많은 의견을 개진하고 있기 때문입니다. 이러한 사회적 수용에 대한 예기를 보다 진전시킴으로써 이러한 데이터 공유와 관련된 예기도 진전되지 않을까 생각된다. 수많은 자율주행차들의 욕심에 대해 여러 단체들이 진행 중입니다. 이런 움직임에 더 안전한 자율주행차 개발을 위한 데이터 공유를 하자는 소견이 모여 지금보다 더 활발한 공유의 길이 열리지 않을까 생각해 봅니다.본공지는NetApp이라는중견기업에서자율주행차의Data관리와과로가아닌제품을소개하는것이었습니다. 문장 중간에 포함된 Net App제품에 대한 소개는 제외하고 자율주행 Data관리 프로세스를 간단하게 소개했습니다. 만약 Net App관련 제품 정보가 필요하신 분 계시면 아래 참고자료의 원문 사이트를 참조하시기 바랍니다.P.S 검색으로 보시다가 원하시는 이야기를 찾지 못할 경우, 태그 역시 검색을 해보시면 더 많은 자료를 찾을 수 있습니다. 그래도 질문이 없으시면 저에게 연락주시면(이메일, 편지), 제가 아는 범위 내에서 도와드리도록 하겠습니다. 아무것도 가지지 않아도 됩니다.Over the Vehicle!!!참고 자료



    댓글

Designed by Tistory.