Projects 4

[논문리뷰] Attention-based Deep Multiple Instance Learning

오늘의 논문 링크: https://arxiv.org/pdf/1802.04712.pdf Attention-based Deep Multiple Instance Learning , 2018 multiple instance learning (MIL) 란, 의료영상과 같이 annotation이 약하고, ROI(region of interest)가 대략적인 데이터들을 학습할 때 발생되는 문제들을 해결하기위해 고안되었다(e.g., computational pathology, mammography or CT lung screening) . 이는 의존성과 규칙성이 없는 bag of instances를 하나의 클래스로 정의 하고, 모델이 이를 학습하여 bag of instances 를 예측하는 문제를 다룬다. 하지만 기존..

[논문리뷰] Object Detection : Yolov7 - Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

최근 오브젝트 디텍션의 yolo 모델이 다시한번 업그레이드 되었다! YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors git :https://github.com/WongKinYiu/yolov7 그림과 같이 COCO벤치마크 실험에 따르면 Swin, ConvNeXt 보다 좋은 성능을 보이고 있으며, 심지어 FLOps 도 104.7G 로, YOLOv4 (142.8) 보다 15% 줄였다. 이 외에도, 본 논문이 기여한 것은 다음과 같다. 1) Trainable bag-of-freebies : 모델을 더 좋게 학습시키는 여러 방법들 2) Object detection 에서 다음 두가지의 어려움이 되는점..

[Git] EasyOCR 뜯어보기.

Intro OCR (Optical Character Recognition) 기술은 최근 고도화된 딥러닝을 기반으로 크게 성장 중이다. 고성능의 OCR 프로그램은 다음과 같은 프로젝트에서 사용되어질 수 있다. 자동화 된 데이터 처리 및 데이터 입력 ( 예 : 이력서 지원자 추적 시스템) 서적 표지의 사진을 찍는 것 만으로, 손쉬운 검색( 쇼핑 페이지나, 도서관이라면 길찾기 서비스로 전환 ) 필기체를 컴퓨터가 읽을 수있는 텍스트로 변환, 문서화 용이 시각 장애가있는 사용자를 돕는 독자 프로그램에서 문서를 더욱 유용하게 사용 역사적인 문서와 신문 보존, 검색 가능 데이터 추출 및 회계 프로그램으로의 전송 (예 : 수령 및 송장) 검색 엔진 에서 사용할 문서 인덱싱 스피드 카메라 및 레드 라이트 카메라 소프트웨..

Projects 2022.03.10
반응형