딥러닝 이미지 인식 예제

KITTI 비전 벤치마크 제품군은 자율 주행 차량을 위한 모델 교육용 도로 이미지를 제공하는 또 다른 오브젝트 세분화 데이터 세트입니다. 이것은 이미지 인식의 간단한 예입니다. CNN널리 응용 프로그램의 다른 유형에 사용, 특히 컴퓨터 비전. 유명한 작품에서 사진으로 신경 스타일 전송의 예 “예술 스타일의 신경 알고리즘”에서 찍은 아래 이미지를 확인하십시오. 왼쪽에는 다른 이미지 분류 챌린지의 몇 가지 예제 이미지가 표시됩니다. PASCAL 챌린지에는 약 20,000개의 교육 이미지와 20개의 개체 범주만 있었습니다. 그 도전은 아래에 묘사 된 바와 같이 “새”, “개”, “고양이”와 같은 매우 일반적인 클래스 범주를 했다. ImageNet 챌린지로 이동하면 완전히 새로운 볼 게임입니다. ImageNet은 모든 종류의 개를 포괄하는 “개”라는 일반적인 클래스를 갖는 대신 각 개 종에 대한 클래스를 가지고 있습니다. 사실, 대신 PASCAL “개”카테고리, ImageNet은 강아지의 다른 품종에 대한 120 카테고리가 있습니다! 따라서 이 작업에 사용하는 모든 모델/알고리즘은 매우 유사하게 보이고 구별하기 어렵더라도 이러한 매우 세분화된 특정 클래스를 처리할 수 있어야 합니다.

파이썬 코드를 자세히 이해하기 전에 이미지 분류 모델이 일반적으로 어떻게 설계되는지 살펴보겠습니다. 이 프로세스를 4단계로 나눌 수 있습니다. 각 단계마다 실행하려면 일정 시간이 필요합니다. 이 모든 진전을 보는 것은 대단한 일이지만, 우리는 항상 발전하기 위해 노력해야 합니다. 이미지 분류에서 딥 러닝 모델에는 여전히 많은 과제가 있습니다. 이러한 과제는 우리가 앞으로 나아가고자 하는 경우 해결해야 할 중요한 과제입니다. 여기서는 제가 중요하다고 생각하고 연구원들이 적극적으로 해결하려고 노력하는 몇 가지 를 살펴보겠습니다: 2012년까지 ImageNet은 거의 130만 개의 교육 이미지를 가지고 있었습니다. 이러한 대규모 이미지 분류 작업의 주요 과제는 이미지의 다양성입니다. 여기서 우리는 그 예의 몇 가지를 살펴 수 있습니다. CNN은 이미지를 처리하기 위한 모든 항목의 기본 모델로 사용됩니다. 요즘 이미지 인식을 위한 재발 신경망(RNN)의 사용에 대해 언급한 논문이 있습니다.

전통적으로 RNN은 텍스트 및 음성 인식에 사용되고 있습니다. 벤치마크 문제로 사용되는 이미지 분류의 가장 인기있는 예는 MNIST 데이터 집합입니다. 당신은 즉시 그것을 인식할 것입니다 – 그것은 (호화로운) 차입니다. 한 걸음 뒤로 물러서서 이 결론에 도달한 방법을 분석하십시오 – 당신은 이미지를 표시하고 그것이 속한 클래스 (이 경우 자동차)를 분류했습니다. 간단히 말해서 이미지 분류가 전부입니다. 아마도 오디오와 같은 다른 양식과 이미지 간에 매핑하는 방법을 배웁니다. 우리가 모델을 구축에 뛰어 들기 전에, 나는 당신이 여기를 클릭하여이 드라이브로 이동하여 필요한 모든 교육 및 테스트 데이터 세트를 다운로드해야, 작업 디렉토리에 “test_set”과 “training_set”라는 폴더를 모두 다운로드, 그것은 거기에로 시간이 걸릴 수 있습니다 두 폴더에 있는 10,000개의 이미지로, 이는 학습 데이터와 테스트 데이터 집합입니다. 새 디렉터리를 만들고 이름을 “무엇이든_you_want”로 지정하고 위에서 다운로드한 데이터 집합 폴더를 붙여넣습니다. 딥 러닝 머신은 언어의 방언을 구별하기 시작했습니다.

기계는 누군가가 영어를 말하고 있다고 결정한 다음 방언의 차이를 말하는 법을 배우는 AI를 참여시킵니다. 방언이 결정되면 다른 AI가 특정 방언을 전문으로 합니다. 이 모든 것은 인간의 개입없이 발생합니다. 이미지 전처리용 Python 코드는 다음과 같습니다.