人気ブログランキング | 話題のタグを見る

Tullyz bis /R-D1ときどきM

富山の旅(58)









富山の旅(58)_d0108132_18144973.jpg


いろんな薬のパッケージ。
今も昔もパッケージデザインは大切なマーケティングツールだ。


---------------



【ラズベリーパイzeroでキッチンスケールのデジタル数字を読んだ話】 その2

昨日のプログラムをどんな状況でもちゃんと動くようにするためには、
明るさ調整やキッチンスケールなどの液晶の位置に合わせて、いくつかの設定値を
決める必要がある。
キッチンスケールの液晶の座標と、画像をモノクロ2値化するときの
スレシホールド(しきい値)を決めるために、毎回フォトショップで座標を調べたり、
2値化した結果を書き出して確認したりするのは面倒なので、
それをやるための設定プログラムを作った。
写真上の液晶部分をマウスでドラッグして領域を表示させ、
スレシホールドにしたい画素で右クリックしたら、その明るさの値で
モノクロ2値化した画像を表示させる。
これで必要な設定データを簡単に決めることができるようになった。

スライダーの作り方や、フォトショップなどで見かけるマウスドラッグで
四角を広げる方法も知らなかったので、いろいろ勉強になった。

そんなこんなでいろいろやってみたのだが、一番の問題は明るさが変わると
読めなくなること^^; 当然ではあるのだが、照明が消えると読めなくなる。
24時間ずっと計測しておきたい状況だと、ずっと一定の明るさの照明が必要。
その状況を維持するのが一番大変かもしれない。




ラズベリーパイzero 2 が発表になった
RAM容量、CPUクロックは変わらないが、1コアから4コアになった。
従来のRaspberry Pi Zeroと比べてシングルスレッド性能が40%、
マルチスレッド性能が5倍向上! ラズベリーパイzeroでは顔認識のようなAIをやると
ちょっと使い物にならなかったのだが、これで解決!
まだ無線の技適認証が下りていないので、買えるまでにはもう少しかかりそう。



.


# by tullyz1 | 2021-10-29 00:15

富山の旅(57)






富山の旅(57)_d0108132_09262767.jpg






富山といえば薬売り。




----------------



【ラズベリーパイzeroでキッチンスケールのデジタル数字を読んだ話】

せっかくカメラが付いているラズベリーパイzeroなので、電卓やキッチンスケールのデジタル数字を読んでくれると
何か素敵なことに使えるかもしれない。
やり方としてはAIを使って文字を識別する方法と、OCRを使って文字を読む方法がある。
これまでの経験としてAIは処理が重いので、CPUが熱くなったり、ラズベリーパイzeroでは
処理時間がかかり過ぎたりする懸念がある。
そこで今回はOCRを使ってみた。
OCR(Optical Character Recognition 光学的文字認識)はスキャナーなどで文字を読むときに
使われる技術で、手書き文字は無理だが印刷物なら結構ちゃんと読んでワード文書などにして保存することができる。
スキャナーの付属ソフトとして提供されていることが多い。
Tesseract-ocr という画像認識ライブラリがPython用に提供されているので、それを使った。
デジタル数字(7セグメント文字)用の学習データは letsgodigital というものが提供されている。
ラズパイのカメラでキッチンスケールの液晶を撮影して、画像をグレースケールにして、
モノクロに二値化して、その画像データを Tesseract-ocr に渡すと、とりあえず数字にすることができた。

実用化するためには、液晶の画像をできるだけきれいに撮影するとかいった地味なチューニングが必要だが、
普通に撮影しただけでも識別できたのである程度きれいならいいかと。

この技術はいつか使える日が来るかな?







.


# by tullyz1 | 2021-10-28 00:14