2007-03-23
■顔とメールアドレスが一致しない
チームの元気度チェックなるものがあって、その中の1つの項目が「チームの中に顔とメールアドレスが一致しない人がいる」。
「顔」と「名前」じゃないんだなぁ。
■英語/中国語/ハングル版はWebじゃなくてpdfで
右上にある、Englishや中文、ハングルのリンクはhtmlページじゃなくてpdfだ。
なるほどそういう手もあるか。
図書館(のWebサイト)の場合、刻々と変わる情報を提供するのじゃなくて、利用の手引きを提供するというその一点に徹してもいいわけだ。
Webでの蔵書検索もあるけど、ここの部分で英語やハングルでの検索画面を用意するべきか? と問われれば「必ずしもそうじゃない」と思う。
図書館が管理している目録データは、蓄えている資料の2次データ――メタ・コンテンツ――だ。
その目録データは誰のためにあるのか?
図書館に行けば検索できる端末もあるし、Web検索も提供しているから勘違いしてしまうかもしれないが、目録データは司書のためにある。
利用者が検索によって目的の資料にたどり着けない時に、司書にはその利用者を適切にナビゲートするというミッションがある。
場合によっては、近隣の図書館や都道府県立の図書館に問い合わせして取り寄せる、ということだってする。
そうすると、資料自身は英語やハングルで書かれていようとも、その目録データは日本語での注釈が付随して然るべきだ。だって、司書のための情報なんだから。
そうすると、英語版検索画面です、ハングル版検索画面です、といって検索サービスをやろうとしても、目録データをそのまま出すことはできなくなる。
司書に必要な情報と利用者に必要な情報は確かに違う。
そこを意識して目録データを整備できるか? となると、難しいのだろうなぁ、と勝手に想像する(あくまで勝手な想像です)。
これからも今の状況のままでいいの? という問題提起がなされているかどうかも知らないけど。
でも、いっこうに更新されないままで日本語ページと乖離していく「英語ページ」を作ってしまうよりも、pdf という形式で情報を提供するという姿勢。
そうすることによって、ほぼ更新がないということがそれとわかるわけで、いっそ潔いなぁ、と思った。
■リアルタイム議事録
その方法は、リアルタイム議事録。Netmeetingなどを使って議事録ツールをシェアする。誰かが喋るたびに発言の概要を議事録として記録していく。
諸悪の根源は物理的:英語が苦手な人がいるミーティングの情報伝達効率を上げる方法
Googleライクなミーティングを、ってな記事で書いてあったなぁ。
A Google meeting features a lot of displays. On one wall, a projector displays the presentation, while right next to it, another projector shows the transcription of the meeting.
How to Run a Meeting Like Google
ここでは「リアルタイム議事録」という用語が創出された点に価値があるかと。
via
2007-03-22
■文書フォーマット
メリット:初めての人でも書ける/読める
デメリット:「記述するべき事柄」から乖離したら役に立たない
後者の危険性を監視する必要があるということ。
■全数テスト以外の手法
http://www.jasst.jp/archives/jasst05w/pdf/S4-1.pdf
http://www.jasst.jp/archives/jasst05w/pdf/S4-2.pdf
http://www.jasst.jp/archives/jasst05w/pdf/S4-3.pdf
例えば、パラメータが4個あって、それぞれが {0,1,2} の3通りの値を持つとする。
全数テストをしようとすると\(3^4\)
のパターンとなる。
テストの「質*1」を落とさずにパターン数を減らそう、という話題。
S4-1.pdf が「直交表」「HAYST法」というものを、S4-2.pdf が「App-pair法」というものを説明している。S4-3.pdf が公開質問会。
基本的な考え方は、テストパターンの絞り込みを個人の know-how に依らないで行うもの、ということだろう。
先の例だと全数テストで\(3^4=81\)
パターンある。
現実的には、81回テストするのではなくてもっと減らしたい。その時に個人の know-how で"これとこれをやってこれはやらない"という判断でやると、
- どの程度ちゃんとしたテストなのか判らない
- 大事な組み合わせを抜かしていないかという不安
- ある機能について、ONの状態ばかりテストされていて、OFFの状態ではほんの少ししかテストされていない
なんていうバラツキがあったりする(あっても判らない。評価できない)。
そういう問題を排したテストパターンを作れますよ。と、そういうことだと認識した。
*1 こいつの定義が難しいわけだけどここでは直感的な解釈でスルーしておく。
2007-03-19
■科学とソフトウェア 永遠のβ版とリリース版
ちょっと引用が続くがご容赦を。
タイトルどおり、科学を永遠のβ版とみなすのだ。
404 Blog Not Found:科学=永遠のβ版
(略)
もっとも、実は科学の世界もソフトウェアの世界も、一つ小さからぬ共通の課題を抱えている。コーダーたちが「リリースエンジニアリング」と読んでいる問題である。
ソフトウェアとハックの喩えはなかなか良いものだと思いますが、非常に重要な違いがあることを忘れてはいけません。科学がソフトウェアと違うのは、「これがリリース版である」といった一方的な宣言が不可能である事です。
Skepticism is beautiful - 『404 Blog Not Found:科学=永遠のβ版』
「リリース版」宣言をした瞬間にそれは「ニセ科学」になってしまうのです。
「永遠のβ」であってもリリースエンジニアリングは必要だし、βX版(Xは数字、β1とかβ2とか)のことをリリース版と呼んでも差し支えないだろう。
nightly build と一線を画する意味での「リリース版」に違いはない。
後続のバージョンによって常に上書きされる可能性のあるリリース版、ってのはソフトウェアにもある。
厳密にはソフトウェアとは違うが、HTML3.0 なんてそうだ。
HTML4がでているけど、HTML2.0 や HTML3.2 は現在でも通用する(実際に使われるかは別の話だけど)バージョンだ。
HTML2.0 は後続のバージョンが出ても抹消されていないが、HTML3.0 は違う。
This document has been superceded.
HyperText Markup Language Specification Version 3.0
なのだ。HTML3.2 によって上書きされた、今はないことになっているバージョンだ。
例えばニュートン力学の「万有引力は質量に比例して距離の2乗に反比例する」ってのは、ソフトウェアの比喩で言うなら、
「すごく古いバージョンで限定された場面でしか使えないけど、使い所さえ間違わなければ充分役に立つし何より動作が軽い」
ってなところか。
いずれ上書きされてしまうバージョンかも知れないけど、まだ使える。
どっちみち比喩なんだし、「β版」と「リリース版」に区別を設けるとか、「リリース版」っていったらそれはもう変えられない/取り消せないバージョンのことじゃないか、とか言うことにあまり意味は無いだろう。
で、弾さんの「科学をハックする」という比喩だけど、これで頭に浮かんだのは、去年の「惑星の定義と冥王星」の話だった。
10年以上は前に知られていた(そういう意見が存在した)ことが、衆目に対して「リリース」されるまであんなにもごたごたしたわけだ。
それでいて面白いことに、「なんかよく分かんないけど科学者たちが会議を開いて突然そんなことを決めるのか!」というような反応を示した人が少なくなかったように思う。
やっぱり、ハックというのはそういうものをこよなく愛する一部の者の間でしか広まらなくて、結局「リリース」というフェーズが不可欠なんだろうな。
ハックとか、私家版パッチとか、そういうものがあったことを知らない人――知ろうとしない人にとっては「リリース」がイコール「真実になる瞬間」なのか。
だとしたら、まぁ、あんまり関わり合いたくはないわな。
■その"水"は重い?
ナノクラスターってなによ? -- 下の説明図が実にわかりやすいです。
檜山正幸のキマイラ飼育記 - 松岡農水相もなんだが、その“水”はなによ?!
この説明図を素直に見ると、「ナノの水」は「普通の水」よりも100倍比重が高いわけですな(この図が"断面"だと仮定すると1000倍)。
コップ一杯が10kgより重い!
そんなことしても何も変わらんって、基本的に水道水と同じだもん。
檜山正幸のキマイラ飼育記 - 松岡農水相もなんだが、その“水”はなによ?!
「水道水をそういう風にして飲む人はいない」ことがこの説明のトリックなのでは?
ならば、ここはやはり「水道水やミネラルウォーターを同じようにして飲むのと変わらん」かと。
■祝・数学ガール発刊披露!
結城浩の最新刊『数学ガール・ミルカさんとテトラちゃん』の紹介ビデオです。
結城浩のはてな日記
いきなり主題歌とか流れたり、ミルカさんやテトラちゃんがくるくる回りながら登場したらどうしよう、とか思った(嘘)。
いやめでたいめでたい。
これはかなり「画期的」な本になると思うので、すごく嬉しい。
2007-03-18
■ゲキレンジャー
初めて見た。
判りやすいなぁ。
メレの2面性が予想していたより可愛い。
■電王
最大の欠点は"子どもが主題歌を歌えない"。タイムレンジャーも近いものがあったけど。
2007-03-17
■初心者です
いや、初心者のする質問じゃないよ、それ……。
統計初心者です。重回帰分析をしたいと考えています。重回帰をする前に説明変数間に相関があるものを取り除きたいと思います。数値変数間および数値変数とカテゴリ変数(名義尺度の変数)間については、無相関検定(ピアソンの積率相関)をして判断しようかと考えていますが、カテゴリ変数間についてはどのように検定すればいういのでしょうか?調べたところ、相関比をみる、とか、分散分析をする等というのを見ました。分散分析をしようかとしましたが、その具体的なイメージがわかりませんでした。教えていただけるとありがたいです。
http://q.hatena.ne.jp/1174099101

