Profile_bird

Hey there! whym is using Twitter.

Twitter is a free service that lets you keep in touch with people through the exchange of quick, frequent answers to one simple question: What's happening? Join today to start receiving whym's tweets.

Already using Twitter
from your phone? Click here.

whym

  1. 読みの困難なテキスト部分のスポッティングをやってみたい。そのための予備調査としてはてなキーワードとウィキペディア項目名の読みを naist-jdic でどれだけカバーできるか、mecab n-best での適合率/再現率をみてみたい
  2. 日本語300文字の発表概要。2.14 tweetと思うと、書ける量はかなり少ない
  3. 言語処理学会 NLP2010 の申し込み締切りが今日であることに気づく
  4. 自分にとって英語で一番足りていないのは、基礎語彙数百よりは”むずかし”くて専門用語よりは”むずかし”くない単語だと思う。その辺の語彙は、書く/話すとき、日本語と比べてパット出てくる度合いが極端に低い。
  5. Google Dictionary (English) の語釈文は Cobuild らしい。手元のCobuild for Advanced Learners 3版と比べてみたらほとんど同じだった。http://bit.ly/8P5CsT 一番よく使ってる辞書なのでうれしい
  6. 英語スペルチェックでも文頭キャピタライゼーションを調べるときに文分割やってるはずだし、スペルチェック業界的には文分割はたいしたことではないのかも
  7. @whym 文分割が必要だとすると、あんまり簡単な処理じゃない >感嘆符のあとの空白の有無のスペルチェック
  8. @makimoto 例外は、口語でなおかつ文中の場合だけ……ですよね(「こうだ!と決めてから取りかかった」みたいなケース) http://bit.ly/66Xdnn
  9. 日本語の手書きからキーボード(かな漢字)への移行は、英語の手書きからキーボードへの移行よりもかなりギャップが大きいと思うんだけど、もしも、英語話者が単語全体で形をイメージして書いてるのなら、それほどでもない。
  10. 「コミュニティ間の情報やヒトの流量は、コミュニティ規模の積÷距離に比例する」 (G. K. Zipf, 1946) http://www.jstor.org/pss/1417611
  11. 『東京の空間人類学』http://bit.ly/4JOGpy がすごく良い。特に1章の〈「山の手」の表層と深層〉、町としての東京への見方が変わる。高台南斜面を選んで建てられた大名屋敷が、いまの立派な池や公園になっている、とか http://bit.ly/4zewPs
  12. ntpサーバをLAN内に立てて合わせることにした。外部ntpへの迷惑減らせるのは確かだけど、時刻同期の向上にどれほど効果があるかはわからない
  13. @hrjn クラスタリングは実用的には、対象によってメジャーな手法がけっこう違うように思ってますが、どうでしょうか。画像でよく使われる spectral clustering がテキストだといまいちとか
  14. @hrjn 偏りはあると思いますが、ここからある程度たどれます http://bit.ly/6WGCxU
  15. RT @preferred_jp: 東大情報理工クリスマスレクチャーのパネルディスカッションにて、@hillbigがモデレーターをやります!米澤明憲先生 * Twitter * Google * PFI! > http://bit.ly/77kZm3
  16. 分散makeがうまく行かないと思っていたら、マシン群のうち1台のntpdが止まってて時計が2分ずれていた……
  17. "a SVM" も "an SVM" も、実際同じくらい使われているらしい http://bit.ly/52vrio http://bit.ly/7vgowt 
  18. a SVM か an SVM か問題: Chicago Style Q&A: Abbreviations http://bit.ly/6qIN0W
  19. 貸出/返却のタイミングで本人にメールを送る、という形なら図書館の貸出履歴保存問題にもひっかからないんじゃないかと思う
  20. 図書館で本を借りる→あまり読まずに返却期限を迎える→数ヶ月後また読みたくなったけど書誌情報を忘れている ということが多すぎるので、図書館は返却記録を利用者にメールしておいてほしい