« 2008年9月 | トップページ | 2008年11月 »

2008年10月

2008年10月18日 (土)

リンク張りに関する引用とリンク集

リンク張りにリンク先の許可はいらない

  • リンクに許可は不要です - 情報教育Wiki(奥村晴彦氏Wiki)
    http://oku.edu.mie-u.ac.jp/~okumura/compedu/?%A5%EA%A5%F3%A5%AF%A4%CB%B5%F6%B2%C4%A4%CF%C9%D4%CD%D7%A4%C7%A4%B9
  • 無断でリンクを張ることは著作権侵害となるでしょうか。(社団法人 著作権情報センター)
    http://www.cric.or.jp/qa/multimedia/multi14_qa.html
    「結論を先にいえば、リンクを張ることは、単に別のホームページに行ける こと、そしてそのホームページの中にある情報にたどり着けることを指示す るに止まり、その情報をみずから複製したり送信したりするわけではないの で、著作権侵害とはならないというべきでしょう。」
  • 藤原 肇(ふじわら はじめ)氏ページから
    http://www2.tba.t-com.ne.jp/dappan/fujiwara/fujiwara.html
    「私の本からの引用は出典あるいは出版図書名の引用という国際的な礼儀さ え守れば、引用された人がたとえ困ると思っても、勝手に引用できるのは世 界における常識です。だから、今後も、いちいち私の承認を得る必要は全く なく、好きなように勝手にやって下さい。悪用したと文句を云うのは日本の タコ壷の中の連中ですから、脱藩人間はそんなことは無縁だと思います。」 藤原肇(1998年7月1日付の手紙から)
  • リンク、フリー?
    http://lantian.kir.jp/net/c1.html
  • こっそリンク(無断リンク)
    http://12k.s2.zmx.jp/doujin/site/doc/secretLink.html

役に立つリンク(三好万季氏著書からの引用)

三好万季著「四人はなぜ死んだのか」2001年, 文春文庫、株式会社文藝春秋 からの引用です。



(引用始まり)

ハリソンバーグ高校のサイトで何と言っても圧巻なのは「Harisonburg High School Library」というリンク集です。十八の「サブジェクト・エリア・リ ソーシズ」の中から「サイエンス」をクリックしてみます。

すると、「科学一般」「解剖学」「天文学」「生物学」「化学」「環境およ び生態系情報」「エネルギー」「疫学(疫病)」「遺伝学」「気象学」「物理 学」「動物学」に分類されたリンク先が、数ページにもわたって現れます。

試しに「Genetics」(遺伝学)から「Human Genome Project Information」 (ヒトゲノム・プロジェクト情報)をクリックしてみると、そこにはヒトゲノ ム計画に関する壮大な一大パノラマが展開されます (http://www.ornl.gov/TechResources/Human_Geno/home.html) 。ヒトゲノ ム関連の情報の全てを、このサイトから得ることができるのです。

過去私は、百を越える数の高校のウェブ・サイトをネット・サーフしていま す。それこそウェブ・サイトの作り方は千差万別。学校によって多種多様で すが、間違いなく言えるのは、優れた学校は、やはり優れたサイトを運営し ている場合が多いということです。

ここで優れたサイトというのは、生徒の学習や調査研究に役に立つサイト、 ということです。役に立つかどうかは、端的に言えばリンクで決まります。 リンクがインターネット上の膨大なリソースに対して、ポータル(入り口の)・ サイトの機能をうまく満たしていればいるほど、生徒にとってはそれだけ大 いに役に立つのです。

(引用終わり)

ハリソンバーグ高校サイトに行ってみる

現在のハリソンバーグ高校サイトでは、そのトップページからLibrary → Subject Area Links → Science → Biology →Genetics → Human Genome Project Informationへとたどることで目的のページに到達する。


著書本文に記されている

http://www.ornl.gov/TechResources/Human_Geno/home.html

はリンク切れで検索ページに案内され、目的のページではない。これは次に変
更されている。

http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml

三好万季氏関連サイト

  • Maki's Room
    http://www.platz.or.jp/~yoroz/
    平成11年以降のページ更新はないようです。
  • 「『天才少女論客』三好万季の裏で蠢くタカ派親父は詐欺師だった!の証明」という噂の真相
    http://www.platz.or.jp/~yoroz/shinsou1.htm
    ページの最後に平成11年12月16日とあり、三好義光氏の署名があります。


ページランク(佐々木俊尚氏著書からの引用)

佐々木俊尚著「グーグル Google」2006年, 文春新書501、株式会社文藝春秋 からの引用です。

(引用始まり)

革新的なテクノロジー

グーグルの検索エンジンは、驚くほどに革新的だった。

まず第一に、グーグルは「クラスタリング(結合)」というコンピュータ・テ クノロジーを採用した。それまでの検索エンジンは大型コンピュータを導入 していたが、しかし爆発的に増加するホームページに追いつかなかった。大 型コンピュータはいったん導入したら入れ替えるのがとても難しいからだ。 これに対してグーグルは、普通の安価なパソコンを数千台も並べ、それらを 一台の仮想のコンピュータとして使えるようにする「クラスタリング」とい う技術を採用した。一台一台は性能が低くても、数多く用意すればスーパー コンピュータと同程度か、あるいはそれ以上の性能を発揮できてしまうのだ。

このクラスタリングによってグーグルは、爆発的に増えていくホームページ を難なくデータベース化することに成功した。いまやグーグルは、二十憶も のホームページを収集していて、圧倒的な能力を世界に見せつけている。

そして第二に革新的だったのは、グーグルが「ページランクテクノロジー」 という新しい技術を作り出したことだった。

このテクノロジーの基礎になっているのは、「人気のあるホームページから リンクが張られているページは良いページ」という考え方だ。たとえばヤフー に紹介文が載っているようなホームページだったら、個人のページであって もかなり信頼度は高いと言える。逆にどこかの会社の公式ホームページであっ たとしても、インチキなオンラインカジノやポルノサイトからしかリンクが 張られていないと、「この会社は何だか胡散臭いな」と判断されてしまうこ とになる。

もちろん従来からあった検索エンジンも、リンクの数は考慮に入れていた。 「たくさんリンクされている方が良いホームページ」という判断基準をアル ゴリズムの中に持っていた。ところがこの考え方を逆手にとって、アルゴリ ズムクラッカーたちは「リンクファーム」という手口を考え出した。中身の 何もないホームページを大量に作って、これらのページからポルノサイトや カジノサイトへのリンクを張ったのだ。この手口を使うことでポルノ・カジ ノサイトは見かけ上は、数多くのリンクが張られているように見え、素朴な 検索エンジンはころりと騙されてしまったのである。

暗黒期からの脱出

だがグーグルの考えたページランクテクノロジーは、リンク元がヤフーや MSNなどきちんとしたサイトでなければ、評価されない。いくら悪辣なアル ゴリズムクラッカーといえども、人気のあるサイトをゼロから生み出すこと はできないから、この手法はリンクファームなどの手口を防止するのに非常 に有効だった。

人気のあるサイト、有名なサイトから数多くリンクされたサイトに高い点数 が付けられ、グーグルはその点数に従って、検索結果のランキングを並べ替 えた。この技術によって、「グーグルの検索結果ランキングは的確だ」と人々 に評価されるようになった。そして検索エンジンの世界は信頼を取り戻し、 アルゴリズムクラッカーに支配された暗黒期からようやく脱出することがで きたのだった。

新生なった検索エンジンは、とても気持ちの良い道具だった。自分が求める ことばを入力すれば、ほぼ瞬時に自分の求める結果が画面に表示される。高 度な技術力を持ったグーグルに引きずられるようにして他の企業-----ヤフー やマイクロソフトなども同様に検索エンジン開発を急ピッチで進め、ますま す人々は検索エンジンに依存するようになった。

そして検索エンジンがインターネットの隅々にまで浸透し、人々は単なる情 報収集の道具としてだけでなく、先ほども書いたように、「ナビゲーション」 としても検索エンジンを使うようになってきたのである。

これが一九九○年代末から二○○三年ごろにかけ、インターネットの世界の 中で起きた劇的な変化だった。人々のインターネットを使う「経路」の中心 が、検索エンジンになったのだ。

検索エンジンは、ほとんどのインターネット利用者にとって、ネットを使う 「玄関口」となった。たとえば花を買おうと思っている人は、わざわざ花の 関連ホームページを開いて、そこからバナー広告を探してクリックしたり、 あるいはヤフーなどのホームページから苦労して花の販売ページを探してク リックするなどという面倒なことはしなくなった。

そんなことをしなくても、単純に検索エンジンに「花」と入力し、検索結果 の中からオンラインショッピングできるホームページを調べればすんでしま う。あるいはもう少し検索エンジンに慣れた人なら、「花」「送料」という ふたつのキーワードを入力して検索するだろう。いずれにせよ、「何をする のにでもまず検索」という人が、目立って増えていったのだった。

(引用終わり)

ページランク(森健氏著書からの引用)

森健著「グーグル・アマゾン化する社会」2006年, 光文社新書269、株式会 社光文社からの引用です。

(引用始まり)

インターネットでソフトが無料提供されるという習慣は、第2章のオープン ソースの項で述べた。そんな姿勢はグーグルのサービスでもそこかしこに垣 間見える。

そもそも「ページランク」というグーグルの主要技術も、その発想の原点は、 科学論文におけるリファレンス(参考文献)の慣習を、ウェブのルールに取り 入れようとしたところにある。科学アカデミズムの世界には、過去の優れた 業績に敬意を払い、リファレンスの項に、研究に利用した論文を記載する慣 習がある。

その慣習はグーグルのも受け継がれており、同社のミッションのページにも、 「私が人より遠くを見渡せるとしたら、それは(科学の)巨人たちの肩の上に 立っているからだ」という、近代科学の父、サー・アイザック・ニュートン の言葉が引用されている。

(引用終わり)

(引用始まり)

二四時間三六五日、世界中のウェブデータを集め続ける

グーグルは、世界中のウェブサーバーの、すべてのウェブデータ(テキスト、 画像など)を拾って持ち帰るプログラムを、二四時間三六五日、走らせてい る。そのプログラムは、クローラーやスパイダー、あるいはロボットやボッ トと呼ばれ、つねに自動的に動くようになっているが、その際、頼りにして いるのが、リンクだ。

グーグルのクローラーは、あるウェブページのデータを収集する際、そのペー ジに含まれるリンクを解析する。そこにリンクがあれば、クローラーはその リンク先へと移っていく。そして、移った先のウェブページでも、ウェブデー タの収集とグーグルのウェブサーバーへの持ち帰りを繰り返す。

収集されるウェブデータは、テキストや画像のみならず、そのウェブページ 全体だ。グーグルで検索したとき、リンク先のウェブデータが消失している 場合でも、キャッシュという欄をクリックすると、当該ウェブデータが表示 されることがある。それは、そのURLのウェブデータがグーグルのウェブサー バーに収納されているからだ。

インデクサ→ページランク→検索プログラム対応

次に、グーグルのシステムが行うのは、クローラーが拾ってきたウェブデー タを、インデクサによって細かく分類する作業だ。インデクサとは、キーワー ドを解析したうえで、分類し、索引=インデックスをつくるプログラムのこ とである。一般的には形態素解析と呼ばれる手法が使われるが、グーグルも 独自の形態素解析を行っている。

たとえば「東京都新宿区」という文字列は、いくつもの分け方がある。「東 京都/新宿区」「東京/都/新宿/区」「東/京都/新/宿/区」などだ。

インデクサは、そうした文字列からキーワードを解析し、独自のルールに従っ て索引づけをしていく。

そのインデクサの作業が終った段階で、ようやくページランクによる評価づ けが行われる。つまり、どのページがどれくらいのリンクを張られ、どれく らいの重要度があるかという計算処理を行うのだ。

そのページランクが終わると、最後は検索プログラムへの対応となる。

検索プログラムは、ユーザーが検索用に入力したクエリーを、索引づけされ たインデクサのデータベースに参照させ、そこで一致するものがあれば「検 索結果」として表示する。

ここまでの一連の流れが、グーグルの検索エンジンにおける作業部分だ。

グーグルのサーバーには、世界中のウェブサイトが格納されている

ここで技術的なことを述べたのはほかでもない。こうした検索エンジンの仕 組み自体にグーグルの本質があるためだ。

つまり、グーグルのウェブサーバーには、グーグルのクローラーが認識する かぎりにおいて、世界中のウェブがまるごと入っているのである。地球儀は 本物の地球のあらゆるものを縮小して詰め込むことはできないが、形のない 電子データであるウェブは、そのままコピーすることができる。そんな作業 をグーグルはしているのである。

言い添えておけば、それは短期的なものであるのもたしかだ。

グーグルは、自社のウェブサーバーに最長でも数ヶ月の間しか、収集したウェ ブデータを保存しない。したがって、削除されたウェブページもしばらくは キャッシュに残されるが、次第に消えていく。

だが、つねに数時間から数ヶ月分は、世界中のウェブデータと丸ごと同じも のを、グーグルは保有しているのである。つまり、グーグルのウェブサーバー はある種のパラレルワールドで、グーグルの検索において、ウェブの世界は、 グーグルのものであるであるという言い方もできようか。

逆に言えば、クローラーが拾ってこないウェブデータは、グーグルでは認識 されない。だからこそ、グーグルで認識されないウェブサイトは、ほぼ存在 しないのに等しいということになるのである。

世界をデータベース化する

そこで注意すべきは、グーグルは単にデータベースを設計したのではなく、 世界中のウェブデータそのものを、データベースにしてしまったということ だ。

通常、ウェブで働くデータベースとは、あるウェブサイトの管理のもとに個 別に収納されているが、グーグルはその発想をまるで逆転させた。世界に存 在するすべてのウェブサーバーのデータをかき集めて整理し直すことで、世 界をデータベースにしてしまったのである。

だからこそ、世界中のウェブサイトは、グーグルがウェブで大きな位置を占 めるにつれ、グーグルのルールに従わなければならなくなった。無関係なキー ワードを多く入れればスパムのみなされて排除される。それがいやなら、グー グルのクローラーとインデクサに認知されるように、サイトを構築しなけれ ばならない。それは大げさな話ではなく、事実だ。

というのも、もしあるページの情報をグーグルにクロールされたくないなら、 クローラーを拒絶する識別記号を、ページの記しておかねばならないからだ。 そうでなければ、クローラーは自動的にデータを収集していく。あるいは、 前述のように、スパムとみなされないようにするためには、メタコンテンツ には適正な数のキーワードしか記せない。

また、グーグルが自らのサイトで記しているように、ウェブサイトは、グー グルの「ウェブマスターのためのガイドライン」に従ったかたちでつくるこ とが求められる。

逆に、グーグルが見つけられないものは、ウェブの世界にはないものとされ る。

グーグルがウェブの世界を支配しているという言い方は、恣意的(しいてき) なニュアンスが宿るが、少なくともグーグルの規格に合わせざるをえない部 分は、事実、ある。それが二○○六年のウェブの現状だ。

だが、こうしたグーグルの仕組みを見ていくと、もうひとつ重要なことに気 づく。それは、現在のような検索システムが続くかぎり、誰がウェブで何を しようと、その振る舞いはそのままグーグルの利益につながっているという ことである。

なぜか。

それはグーグルのウェブサーバーに収納されるあらゆるデータが、グーグル の収益の根源である広告-----アドワーズやアドセンスにつながっているた めだ。

(引用終わり)

  • ジャーナリスト/ライター森健のウェブサイト(moriken.org)
    http://moriken.org/

| | コメント (0) | トラックバック (0)

2008年10月13日 (月)

UNIXという考え方

Mike Gancarz著、芳尾 桂監訳「UNIXという考え方」平成13年, オーム社のイ ントロダクションからの引用です。

(引用始まり)

オペレーティングシステムは生きている、息をしているソフトウェアの生命体 だ。コンピュータシステムの魂であり、神経系であり、電子とシリコンを生き 物に変える。オペレーティングシステムは、コンピュータシステムに生命を吹 き込む。

オペレーティングシステムは、その性質上、創造者の哲学を身にまとって現わ れる。Apple社のMacOSは、高度に視覚に訴えるオブジェクト指向のユーザーイ ンターフェースを持ち、「ほら、あなたのすぐ前に」(It's right there in front of you.)というキャッチフレーズと共に登場した。マイクロソフト社の MS-DOSは、文句なしにパーソナルコンピュータ革命のリーダーであり、デスク トップに「メインフレームの香り」をもたらした。DECのOpenVMSでは、ユーザー は「電子思考機械」を恐れているということを前提にしていた。ある仕事を行 なうためにユーザーに与えられる選択肢は、とても少なくかつ強力なものだっ た。

UNIXの創造者たちは、ある極端なコンセプトから始めた。ユーザーは初めから コンピュータを使えるものとみなしたのだ。UNIXは「ユーザーは、自分が何を しているかを分かっている」との前提に立っている。他のオペレーティングシ ステムの設計者が、初心者から専門家まで幅広いユーザーを受け入れようとし て苦労しているとき、UNIXの設計者たちは「何をしているのか分からないのな ら、ここにいるべきでない」という不親切きわまりないアプローチを選んだ。

この前提のため、初期のUNIXは広汎な指示を得ることに失敗した。UNIXは、大 学の研究室に閉じ込められ、象牙の塔に陶酔の香りをもたらした(UNIXのファ イルシステムの階層構造と自然界の物事の秩序とはよく似ている。双方とも親 があって子があって孫がある。この類似性は学問的に研究に値するかもしれな い)。テッキーと呼ばれる人種もUNIXをいじりたおした。彼らにとって、UNIX ほど遊べるオペレーティングシステムは他にはなかった。

残念なことに、ビジネス界はUNIXに価値を認めなかった。UNIXは、ハッカーの おもちゃでしかなく、単なる好奇心の対象でしかなかった。研究室から生まれ、 大学で育てられ、買った人間が自分でサポートしていたオペレーティングシス テムに、リスクを冒してまで投資する企業はなかった。その結果として、UNIX は、その将来を嘱望されながらも15年もの長きにわたって不遇の時代を過ごす ことになる。

しかし、1980年代初頭に驚くべきことが起こった。どのオペレーティングシス テムより柔軟で移植性に富み、性能の高いオペレーティングシステムがあると いう噂が広まりだした。さらには、それは格安の費用で広く入手でき、ほとん どのマシンで動作するという。

UNIXの噂は、ちょっと信じられないくらいの素晴らしいものだった。しかし、 実際には「預言者は殺される」という歴史が繰り返されることになった。ある 極端なアイデアが世界を本当に変えようとするとき、私たちはその新しい知ら せをもたらしたものを敵視して排除してしまう傾向がある。コンピュータ業界 の主流からは、これらの「UNIX信者」たちはソフトウェアの漸進的な発展とい うものに興味がないとしか思えなかった-----実際、彼らが目指していたもの は、それまでにはなかった全く新しい考え方なのだった。

UNIXは、徐々にコンピュータ業界へと浸透していったが、会社の官僚組織はこ の革命的な考え方を拒否した。PCとメインフレームの秩序だった世界が好きだっ たのだ。苦労して覚えたいくつかの簡単なコマンドだけで日々の仕事ができ、 それで「職の安定」が得られていると彼らは信じていた。そこではUNIXは悪魔 となった。UNIXは本質的な悪ではなかったが、現状を脅かしたゆえに敵視され たのだ。

何年もの間、UNIXの開拓者たちは片隅でひっそり暮していた。この急進的な考 え方を受け入れてくれるところはどこにもなかった。ときにUNIX信者の長話を 聞いてくれる人もいたが、たいてい落ちは決まっていた。「UNIXはいいよ。け れど、本当に何かをやろうと思ったら、やっぱり_______を使わなくちゃ」(下 線部には、好きなオペレティングシステムの名前を入れてほしい)。

オペレーティングシステムの考え方というのは、宗教に似ているかもしれない。 真理を発見したと思っている者は、そんなに簡単にはその考えを捨て去ろうと しない。UNIXの使徒たちは、いつの日か世界が変わりソフトウェアの天国を見 ることができると信じ、既存の秩序に対して挑戦を続けた。

ビジネス界がUNIXの進出を阻むべく懸命だった一方で、大学ではUNIXは暖かい 腕で受け入れられた。カラーテレビや電子レンジ、ビデオゲームが当たり前の 若い世代が大学に入学すると、そこには、磁気メディアの料金だけで配布され ていたUNIXがあった。これらの若い世代は、先入観がない真っ白な心を持って おり、教授たちは、コンピュータ界の主流からはかなりかけ離れたコンピュー タのあり方について教え込んだ。

あとは、歴史が示すとおりだ。

現在では、UNIXは、かつて考えられなかった分野からも急速に受け入れられ始 めている。学問の世界では文句なしに主流の位置を占めており、ビジネス用や 軍事用のUNIXアプリケーションも日々増えている。

私は、UNIXが世界標準のオペレーシングシステムになるのは時間の問題だと何 年も前から言い続けてきた。それは、少なくとも間違ってはいなかった。しか し皮肉なことに、その標準オペレーティングシステムは「UNIX」と呼ばれるこ とはなさそうだ。UNIXという名前の持つ価値に気付いた企業が、弁護士を使っ て大急ぎで、UNIXを商標として登録してしまったのだ。今後は、「オープンシ ステム」という名のもとに、インターフェースが設計され、標準が提案され、 多くのアプリケーションが開発されることになるだろう。だが、心配はいらな い。いずれにしろUNIXの考え方こそが、これらの動きを駆り立てる原動力となっ ているのだから。

(引用終わり)

| | コメント (0) | トラックバック (0)

« 2008年9月 | トップページ | 2008年11月 »