BEST PATH RESEARCH
  • ホーム
  • BPRについて
  • サービス
  • 会社概要
  • ニュース
  • ブログ
  • お問合せ
  • English
  • 日本語

  • English
  • 日本語

  • By  BPR
  • 0 comments
  • 2023-03-10

論文発表 “Automatic Detection and Rectification of Paper Receipts on Smartphones”

BEST PATH RESEARCH は、スマートフォンのカメラを用いた紙の領収書の検出と補正に関する最新の研究結果を arXivの論文リポジトリに掲載しました:

https://arxiv.org/abs/2303.05763

本研究では、潜在的に変形しているオブジェクトに対してコーナー検出を行う新しい技術を開発し、干渉する不要のオブジェクト(同じくコーナーを持つかもしれない)を無視しながら、紙のレシートの4つのコーナーをそれぞれ検出できるようにしました。

レシートの4つのコーナーを特定した後、従来の画像認識技術である透視変換を使用して、 変形した可能性のある画像を直線または⻑方形の画像(真上から見たような、いわゆる「鳥瞰図」)に変換します。
このように画像を直線化することで、画像内のすべての線が水平に揃うため、OCR(光学式文字認識)や NE(名前付き文字)検出など、次の処理が容易になることが期待されます。

この研究開発は、当社 CEO の Dr. エドワード・ウィタカーを中心に行われ、論文で紹介したモデルや技術を統合した iPhoneアプリのデモを作成しました。このアプリでは、「微調整」された物体検出モデルを使用し、それを量子化して Tensorflow Lite に変換し、ミドルレンジのiPhoneデバイスでリアルタイムに実行できるようにしました。

Keywords: Perspective Transform, Tensorflow Lite, iOS, object detection, corner detection, arXiv
Tags:
news

Search

Recent News

  • 論文発表“Large Language Models for Named Entity Extraction and Spelling Correction”
  • Intel Connection 2023にBEST PATH RESEARCH が出展
  • ナビットの「お仕事 PICKUP」に BEST PATH RESEARCH が紹介
  • 論文発表 “Automatic Detection and Rectification of Paper Receipts on Smartphones”
  • 論文発表 “Extending TrOCR for Text Localization-Free OCR of Full-Page Scanned Receipt Images”

Recent Blog

  • 日本語レシートOCRと名前付きエンティティ抽出:AWS SageMaker ServerlessとTriton Inference Serverを使用した複数モデルによる低コスト推論
  • iOS 用自然言語による画像検索

BEST PATH RESEARCH © 2023 All Rights Reserved