2014-12-25

IDEとPython (タイプヒンティング、その他)

Python Blender

Pythonでは、タイプヒンティングの構文が標準化されておらず、実装によって構文がバラバラ。
import周りの規則もややこしいことこの上ない。ということで、コード補完のための定義ファイルの生成周りが理解しきれてない。

bpy.types.bpy_prop_collectionのためにGeneric型が欲しいのだが、PyDevはGeneric型に対応していないらしい。なので、現時点で自動補完するならPyDevよりもPyCharmの方が良いはず。

Does PyDev's type hinting support generic types?
http://stackoverflow.com/questions/23876497/does-pydevs-type-hinting-support-generic-types

PyCharmがジェネリックに対応しているとはいっても、クラスのジェネリック型で__init__が必須だったり、プロパティ(ゲッター)の型の処理が怪しかったりと罠多め。
タイプヒンティングの標準化が進んでいるらしく、それはPyCharmの構文とかなり異なるので、標準化されるまで待った方が懸命かもなぁ。

2014-12-16

K-meansじゃダメだ

画像処理 OpenCV sklearn Python OCR

x軸はグレースケールの色と最頻値との差の絶対値、y軸は画像の外周を中心に円にした時の中心からの距離。下図の右下を切り離したいので、別のクラスタリング手法を使う必要がありそう。

しかし、OpenCVにはk-meansしか用意されていないので、sklearnを入れてみた。色々なクラスタリング法が使えて面白い。ただ、遅いからサンプル数を間引かないといけないけども。

スペクトラルクラスタリングはメモリが大量に必要とのことで断念。
Ward法はk-meansと似た結果でダメだった。
DBSCANは良さげに見えるけど、今回のケースでは不可能。
凝集クラスタリングで良い結果を得られた。

しかし、別のケースでは上手く行ってない。

クラスタ数増やしたら一応上手く行ったけど、安定した方法では無さげ。さてどうするかな。外れ値検出とか? アウトラインフラグメント化とか?

2014-12-15

画像の外周を中心に円にする

画像処理 OpenCV OCR

中心からの距離をk-meansの要素に使えないかなと思って、作ってみた。

import sys
import cv2
import numpy as np
import math

def main():
    if len(sys.argv) != 3:
        print "./circle_transform.py <in_file> <out_file>"
        quit()

    filename = sys.argv[1]
    outfile = sys.argv[2]

    image = cv2.imread(filename, cv2.IMREAD_COLOR)

    if image is None:
        print "input file is not found"
        quit()

    circle = np.zeros([image.shape[0], image.shape[1], 2], dtype=np.float)
    center = [image.shape[0]/2.0, image.shape[1]/2.0]

    for i in range(0, image.shape[0]):
        for j in range(0, image.shape[1]):
            pos = [i-center[0], j-center[1]]
            if pos[0] == 0: continue
#            n = pos[1]/pos[0] # y = nx, x = y/n
#            if n == 0: continue
            circle[i,j,0] = 1.0 - max(abs(pos[0]/center[0]),  abs(pos[1]/center[1]))
#            circle[i,j,0] = 1.0 - math.sqrt(pos[0]**2 + pos[1]**2) / math.sqrt(min(center[0]**2 + (n*center[0])**2, center[1]**2 + (center[1]/n)**2))
            circle[i,j,1] = math.atan2(pos[1], pos[0])

    img_out_size = max(image.shape[0], image.shape[1]) / 2.0
    img_out = np.zeros([img_out_size, img_out_size, image.shape[2]], dtype=np.uint8)

    out_half = [img_out.shape[0]/2.0, img_out.shape[1]/2.0]
    for i in range(0, image.shape[0]):
        for j in range(0, image.shape[1]):
            dist = circle[i,j,0]
            rad = circle[i,j,1]
            idx_x = (math.cos(rad)*dist*out_half[0] + out_half[0])%img_out.shape[0]
            idx_y = (math.sin(rad)*dist*out_half[1] + out_half[1])%img_out.shape[1]
            img_out[idx_x, idx_y] = image[i, j]

    cv2.imwrite(outfile, img_out)

main()

最適化した。

2014-12-13

3.0.0-beta

Ubuntu 画像処理 OpenCV

OpenCV 3.0ではPythonからT-API経由でOpenCLが使えるらしいと聞いて、さっそくパッケージ化して入れてみた。
パッケージは下記。手抜きなので、2.xのパッケージを全部削除してから入れないとダメなど、色々問題あるけれども自己責任で。
http://www4.pf-x.net/nazodane/opencv_3.0.0-beta-1_amd64.deb

3.0ではレガシーなAPIが廃止されたとのことだが、移行ドキュメントが見当たらないし、Google検索では旧APIが引っかかりまくってて残念。取りあえず、引っかかったものだけ挙げてみる。

cv2.CV_LOAD_IMAGE_COLOR → cv2.IMREAD_COLOR
cv2.cv.CV_TERMCRIT_ITER → cv2.TERM_CRITERIA_MAX_ITER
cv2.cv.CV_TERMCRIT_EPS → cv2.TERM_CRITERIA_EPS
旧: cv2.kmeans(data, K, criteria, attempts, flags[, bestLabels[, centers]]) → retval, bestLabels, centers
新: cv2.kmeans(data, K, bestLabels, criteria, attempts, flags[, centers]) → retval, bestLabels, centers
旧: cv2.findContours(image, mode, method[, contours[, hierarchy[, offset]]]) → contours, hierarchy
新: cv2.findContours(image, mode, method[, contours[, hierarchy[, offset]]]) → image, contours, hierarchy

動かしたところ、sudo nvidia-settings -q GPUCurrentClockFreqs を見る限り、ちゃんとOpenCLを使ってるようだ。

2014-12-13

PCIe3.0を有効にする

Ubuntu NVidia

$ cat /proc/driver/nvidia/params
[...]
EnablePCIeGen3: 0
[...]

無効になってる。

/etc/default/grubのGRUB_CMDLINE_LINUXに以下を足して、update-grubすれば良いらしい。

nvidia.NVreg_EnablePCIeGen3=1

2014-12-08

Fast Prototyping

画像処理 OpenCV Blender

Pythonが流行りと聞いたのでPythonからOpenCVを使ってるけれども、ノードベースのUIや簡単なA/B比較に慣れたゆとり世代にはどうにも使いにくい。
というわけで調べたら、BlenderのノードにOpenCVを組み込んだものが開発されているらしい。
https://github.com/damiles/blendocv

これは便利そう…と思ったが、プロジェクトステータスを見ると、まだ開発初期のようだ。スクリプトも使えなさげ。
https://github.com/damiles/blendocv/wiki/Project-Status

2014-12-06

OCRのための二値化