読者です 読者をやめる 読者になる 読者になる

Computing for the rest of us

日記

Computing for the rest of usという言葉がふと思い浮かんだ。自分は情報学科出身でもないし、いわゆるIT系の仕事をしていたわけでもないけれど、様々な事柄を計算機で処理をするのは今後ますます重要になる気がした。

問題/データを見つけることから始めるべし

最近読んだこの記事が面白かった。

(問題を見つけるためにまずやるべきなのはKDDの論文を山ほど読むところから,と前置きをした上で)
(別領域の)専門家を見つけ,彼らから問題とデータを得よう
これまで私は人類学者,線虫学者,考古学者,線虫学者,考古学者,天文学者,昆虫学者,心臓病学者,爬虫類学者,脳波検査技師,遺伝学者,宇宙船専門家たちと研究を行なってきた
このような専門家は面白くて貴重な問題を複数抱えている

少しでも研究に興味がある人,面白いテーマを探している人は「研究に必要なたったN個の事」とかいう記事を読まずに今すぐに"How to do good research, get it published in SIGKDD and get it cited!"を読むべき - 糞ネット弁慶

データマイニングの専門家に対して他の専門家と協力したらいいよという記事(他にも色々)で、確かにデータを専門に扱っている人よりも全然違う分野の人の方が当たり前だけどずっとたくさんいるし、面白い問題もたくさんあるだろうと思う。逆に言うと、データの専門家じゃない人にとっても、データ処理の専門家と一緒になって問題に取り組むというのは、問題への取り組み方の新たなアプローチになるので重要だろう。
でも別のアプローチとして、データ処理以外の専門家がデータ処理を学ぶということも考えられる。これだけいろいろと便利なツールができている世の中なので、初歩的なものであればデータ処理の専門家の手を煩わせずに自らやってしまった方が手っ取り早いかもしれない。研究者が装置の修理を自分の手でやるように、自ら処理することで見えてくるものは少なくないのだから。

手持ちのスキルを活かす

5月、6月の2ヶ月間インターンをして、初めてPythonなるものを学んだ。チュートリアルをせっせと読んでDjangoで単純なものを作ることはできるようになったんだけど、一緒に働いていた10年選手と比べるとスピードが全然比較にならない。20歳くらいから始めて30歳くらいまでやれば10年選手だ。彼らはモックアップとかすぐに作ってしまうし、今のレベルではまともにやっても全然太刀打ちできない気がした。しかし、自分には他の分野でやっていた経験があるわけで、それと組み合わせない手はないなと感じるわけである。そんな簡単に組み合わせられるとは思ってないけど、3年くらいそういう方向に持っていけばなんらかの形にできそうな気がした。

できることがわかれば視点が変わる

特許の価値評価を考えていて、金融工学の本を読んだりしていたのが数カ月前の話。
ふと思い立って、project eulerの問題を25問解いたのが数週間前の話。

githubにソースをアップロードしようかと思ったけどそんな大掛かりでもないのでgistにした。
https://gist.github.com/yosuketanaka
現段階でもこの程度の処理ならできる。そして再び金融工学の本を読んでみたら、視点が変わった。
こんなのPythonで簡単に計算できるじゃないかとか、まあそんなとこ。(まだ思っただけ。)

生物学者とサンプリングとその推定に関する仕事をした時,彼女はある量を推定(estimate)したがっていた
しばらく考えてみると,それは「推定する」必要はなく,「まさにその量を計算する(compute an exact answer)」事が可能だと気付いた
データそのものから得ようとすると何年もかかってしまうようなある量が,計算してみると三日で済んだ

少しでも研究に興味がある人,面白いテーマを探している人は「研究に必要なたったN個の事」とかいう記事を読まずに今すぐに"How to do good research, get it published in SIGKDD and get it cited!"を読むべき - 糞ネット弁慶

何ができるかを知るだけでも可能性は大きく広がる。まだ具体的に何もできてないので何も書けないけど、これまでと比較にならないくらい面白くなってきた。でもその前に著作権の試験勉強をしよう。