
- By BPR
- 0 comments
論文発表 “Automatic Detection and Rectification of Paper Receipts on Smartphones”
BEST PATH RESEARCH は、スマートフォンのカメラを用いた紙の領収書の検出と補正に関する最新の研究結果を arXivの論文リポジトリに掲載しました:
https://arxiv.org/abs/2303.05763
本研究では、潜在的に変形しているオブジェクトに対してコーナー検出を行う新しい技術を開発し、干渉する不要のオブジェクト(同じくコーナーを持つかもしれない)を無視しながら、紙のレシートの4つのコーナーをそれぞれ検出できるようにしました。
レシートの4つのコーナーを特定した後、従来の画像認識技術である透視変換を使用して、 変形した可能性のある画像を直線または⻑方形の画像(真上から見たような、いわゆる「鳥瞰図」)に変換します。
このように画像を直線化することで、画像内のすべての線が水平に揃うため、OCR(光学式文字認識)や NE(名前付き文字)検出など、次の処理が容易になることが期待されます。
この研究開発は、当社 CEO の Dr. エドワード・ウィタカーを中心に行われ、論文で紹介したモデルや技術を統合した iPhoneアプリのデモを作成しました。このアプリでは、「微調整」された物体検出モデルを使用し、それを量子化して Tensorflow Lite に変換し、ミドルレンジのiPhoneデバイスでリアルタイムに実行できるようにしました。
Keywords: Perspective Transform, Tensorflow Lite, iOS, object detection, corner detection, arXiv