« 2009年8月 | トップページ | 2009年10月 »

2009年9月

2009年9月27日 (日)

ココログサイトに置くテキストファイルをutf-8にしなければならない理由

ココログサイトに置くテキストファイルをutf-8にしなければならない理由

Time-stamp: "Tue Sep 22 15:20:20 JST 2009"

ココログのサイトにはプレインテキストファイルを置くことができる。たぶ ん何処のウェブログでもそうなっているだろう。ココログのサイトにアップ ロードするプレインテキストファイルの文字コードはutf-8にしなければな らない。shift_jisのテキストは文字化けする。

理由は分からないがutf-8にすればよいらしいことは次の記事がヒントになっ た。この記事は、大多数の人がココログへ投稿する手順であるはずの、ブラ ウザをココログのサイトにつないで作成するオンライン投稿に関するもので はない。あらかじめ自分のパソコン内でタグを入れてつくったhtmlファイル の完成品をアップロードする場合の注意書きである。

ココログの作成システムであるtypepad(ココログのロゴには「powered by typepad」とある)を使わない投稿方法での注意である。

「任意の HTML ファイルをファイルマネージャでアップロードして表示させ たい場合には、ファイルの文字エンコードを UTF-8 にする必要があります。」

とりあえずutf-8のプレインテキストファイルに差し替えたら文字化けが解 消した。しかしその理由が分からない。その理由はhttpサーバーがホームペー ジなどの色々なデータファイルをブラウザに送ってくるとき、それらのhtml データなどに付けるhttpヘッダーの内容にあった。

電子メールには本文の他にメールヘッダーが付いてくる。それと同じように ホームページのhtmlデータなどにはhttpヘッダーが付いてくるのである。

電子メールのヘッダーには配信途中で通過したメールサーバー情報にfromや toそしてsubjectといったユーザーに有用な情報が含まれる。たいてい通過 サーバーはカットされるがメールヘッダーの全部を表示させることもできる。 メールヘッダーの内容については次のページが参考になる。

Webサーバーが送りつけてくるhttpヘッダーの内容は専門的にすぎるもので 一般のユーザーに身近な情報ではない。そのため通常のブラウザではhttpヘッ ダーを見ることはできない。

httpヘッダーの中に文字コード情報が含まれる場合がある。本文である日本 語htmlファイルで使われる文字コードはこれですよとブラウザに指示する。

ブラウザはhttpヘッダーの指示どうりの文字コードを使ったhtmlファイルで あると解釈して画面に表示する。もし実際のhtmlファイルで使われている文 字コードがhttpヘッダーの指示する文字コードと違う場合は文字化けする。

ココログの一般的な投稿方法であるオンライン投稿ならhttpヘッダーの指示 する文字コードとhtml本文の文字コードが異なるということは起こらない。 ココログの作成システムであるtypepadに直接に入力するのであるからユー ザーが文字コードに触れることはない。

さて、それではどうしてココログのサイトにアップロードしたプレインテキ ストファイルの文字コードがutf-8でないと文字化けするのであろうか。

webサーバーがブラウザに送ってくるデータには必ずhttpヘッダーが付いて くる。電子メールにメールヘッダーが付くのと同じようにwebサーバーが送 りだすデータには必ずhttpヘッダーが付いている。ブラウザが送りつけてく るデータがhtmlファイルではなくてプレインテキストファイルであっても httpヘッダーは付いている。ユーザーにはhttpヘッダーの内容が見えないだ けである。

ココログのhttpヘッダーには文字コードがutf-8であるとの指示がある。ブ ラウザはこの指示に従ってプレインテキストファイルを表示しようとする。 それ以外の文字コードなら文字化けする。

ブラウザの文字コード判定手順

Webサーバーからインターネットを通してブラウザに送られる情報の内容は, ヘッダー部分とHTMLデータに分かれる。このうちhtmlデータはブラウザのメ ニューからタグ入りのソースファイルとして見ることができる。ヘッダー部 分は通常のブラウザでは表示できない。ブラウザにアドオンとして動作させ る付属ツールをインストールすれば見えるようになるという。

webサーバーがユーザーのリクエストに対して返してくるレスポンスはヘッ ダー部分とHTMLデータ部分からなる。ヘッダー部分にutf-8と書かれておれ ばブラウザはそれに従う。ヘッダー部分に情報が無ければhtmlデータ部分に あるメタタグを見る。それも無ければhtmlデータ自体から文字コードを判定 する。

ブラウザの文字化け、文字コード判定手順については次が分かりやすい。

httpヘッダーを見るためのツール

httpヘッダーを見るにはどうするか。グーグル検索によるとインターネット エクスプローラ(ie)やfirefoxの通常版にアドオンとして後付けソフトをイ ンストールすれば見ることができるようになるという。さらに検索すると自 分のパソコンにインストールするのではなくインターネットを介して使うオ ンラインツールのあることが分かる。最初に見つけたのはドイツ語圏のオン ラインツールだった。

ドイツ語圏のツールと聞いて引くことはない。インターネットの発祥は米国 である。その伝統にしたがってhttpヘッダーは英語で書かれる。同じアルファ ベットを使っていてはいてもドイツ語圏であろうとフランス語圏であろうと 事情は日本語圏と変わらない。サーバーの吐き出すメッセージはたぶん英語 である。全世界を相手にするなら英語を使うのがいちばん無難である。英語 がインターネットの裏舞台における標準語であることは間違いない。なお、 このツールに表示される生のhttpヘッダーは英語だがそれに対する解説はド イツ語になる。

「ieHTTPHeadersやLiveHTTPHeaders を使ってHTTPヘッダの確認をすること が出来ますが、それらツールをインストールしていないマシンでもヘッダー を確認したい場合があります。

そんな場合はこのサイトで提供されているWEBベースのツールが使えます。 単にURLを入力すればレスポンスヘッダーを見ることが可能です。(リクエス トヘッダーの指定は不可)

※リンク先は英語のページではないのですが、ヘッダは問題なく確認できま す。英語のページがあったら教えてください:-)」

このオンラインツールのurl書き込み窓にhttp://mrymy.cocolog-nifty.com を打ち込むとContent-Type: text/html; charset=utf-8が表示される。次に http://homepage2.nifty.comではContent-Type: text/htmlだけで charset=utf-8は付いていない。

ココログの記事はすべてutf-8で決め打ちできる。ftpでファイルをアップロー ドするホームページの場合は、ユーザーがアップロードするhtmlファイルの 文字コードはユーザー毎に違う。同一サイトに文字コードの異なるページが あってもおかしくはない。したがってhttpヘッダーで文字コードを指定する ことはできない。

さらに探すと日本国産の同じようなオンラインツールが幾つもある。

テキストファイルは遠慮くださいのメッセージが出る。

ブラウザとwebサーバー間のhttpヘッダーのやり取りについては次の記事が ある。

| | コメント (0) | トラックバック (0)

2009年9月21日 (月)

川巡り記録(2009/06/text)

川巡り記録(2009/06/text)

Time-stamp: "Fri Apr 13 07:45:22 JST 2012"

ハイパーテキスト化していないメモ書きのプレインテキストファイルです。

ブラウザ(インターネットエクロプローラなど)に表示して文字化けする場合は、
表示メニューからエンコーディングをShift-JISなど他のものに変更してくだ
さい。文字コードをutf-8にすれば文字化けしないのですが、そうでないもの
もアップロードしています。

ブラウザのキャッシュのままかもしれないので再読み込み(リロード)も試して
ください。

  1. 岡山・倉敷近辺の河川(2009/06/text)
  2. 岡山市・倉敷市の水道(2009/06/water)
  3. 岡山県の干拓(2009/07/kantaku)
  4. ウォーキング(2009/07/walking)
  5. 鉄道(2011/08/railway)
  6. 岡山・倉敷の神社(2009/08/jinja)
  7. 興除(2009/10/kojo)
  8. 御影供(2010/01/mieiku)
  9. 茶屋町(2010/04/chayacho)
  10. 興除村(2010/04/kojoson)

| | コメント (0) | トラックバック (0)

2009年9月20日 (日)

内容がhtmlのファイル名の接尾辞(拡張子)を「.txt」にする

内容がhtmlのファイル名の接尾辞(拡張子)を「.txt」にする

Time-stamp: "Tue Feb 09 15:31:59 JST 2010"
以下の内容には誤りがあるようです。サーバーは ファイル種別を拡張子(接尾辞)で判断しているのでしょうか。この点が分から ない。

「(キーワード) filetype:txt」でグーグル検索すると内容はhtml(ハイパー テキスト・マークアップ・ランゲージhypertext markup language)で書かれ ていながら拡張子がtxtになっているものがヒットすることがある。

windowsのパソコンで実験をする。ローカル(自分のパソコン内のハードディ スク)に置いた内容がhtmlで書かれたファイルの拡張子を「.html」から「.txt」 に変更する。「拡張子を変更するとファイルが使えなくなる可能性があります」 の警告は無視する。ブラウザのメニューからこれを読み込む。ブラウザはhtml のタグを解釈しないで単なるテキストファイル(htmlのソースファイル)として 表示する。

次に同じファイルの名前から拡張子を取り除く。その際も「ファイルが使え なくなる」メッセージが出る。再びブラウザのメニューからファイルを選択 して開く。この場合はhtmlのタグを解釈してhtmlファイルとして表示する。

次にグーグル検索を使って「(キーワード) filetype:txt」で内容がhtmlタ グ入りのファイルでありながらファイル名の拡張子(接尾辞)が「.txt」のファ イルを探す。こういうイレギュラーなことをするのはパソコンに強い人だか ら、その人達が使う専門用語でグーグル検索する。

リモート(インターネットを介した向こう側)に存在する拡張子が「.txt」 になっているけれども実際にはhtmlのタグが入ったいわゆるホームページのソー スファイルをブラウザに表示する。この場合はhtmlのタグを解釈したホームペー ジの体裁で表示する。

ブラウザのメニューからそのページを自分のパソコンのハードディスク(ロー カル)に保存したものをブラウザのメニューから開く。この場合はホームペー ジのソースファイルを表示する。

もともとブラウザはファイル名に拡張子(接尾辞)が必須でないシステムで開 発された(たぶん)。だからホームページのソースファイルの名前に拡張子 (接尾辞) はなくてもよい。またへそ曲がりに「.txt」を付けても不都合は ない。

windowsのパソコンは拡張子でファイルとそれを扱うアプリケーションソフ トの関連付けをしている。htmlタグ入りのソースファイルに「.txt」拡張子を 付けたへそ曲がりなものに関しては、それがリモートにあるかローカルにある かで表示が違う。

| | コメント (0) | トラックバック (0)

2009年9月11日 (金)

街中でシルバ・コンパスをナビゲーションに使う

街中でシルバ・コンパスをナビゲーションに使う

Time-stamp: "Sat Aug 01 11:49:18 JST 2009"

歩行者や自転車用のナビゲーションがある。持ち運ぶにはかさばる。何より 電池が要る。そして電池は結構はやくなくなるらしい。登山では電池の調達 に困る。

その点、電池不要で軽いシルバ・コンパスはよい。お日様の位置だけで方角 をたてるよりは確実である。地図にはコンパスがぜひとも必要である。土地 勘のあるところなら地図だけでもよい。まったく初めてゆくところでは方角 を失なうことが多い。

登山やオリエンテーリングではシルバ・コンパスを使う。普段の街歩きでも 便利に使える。

シルバ・コンパス

シルバ・コンパスの取り扱い説明書に次が書かれている。

「パリ サンフランシスコ シドニー 香港 札幌 東京 福岡 都市でも山野で も庭のように歩けます」

「1932年スウェーデンで世界で初めて、


  1. 進む方角を地図上で測る分度器

  2. 進む方向を知るコンパス

  3. 進む距離を地図上で測る定規


の3つの機能を持ったコンパスが創りだされました。プロトラクタータイプ
と呼ばれるシルバコンパスです」

「シルバはラテン語で森。森のコンパスです。森のスポーツと呼ばれるオリ
エンテーリングで大多数の競技者に愛用されているだけではなく、NATO軍の
制式コンパスにもなっており、また登山やハイキングの必携品となっていま
す。

シルバの面白さを最大に味わえるのは地図と共に持って、自然の中を歩くと
きです。地図が読めれば読めるほど、シルバは正確な方角を示してくれます」

シルバ・コンパスの真髄は「磁北線と目標物の角度」を分度器を使わずにコ ンパスにセット(記憶)できることです.またこの角度を覚えておく必要もあ りません。

protractor(プロトラクター):分度器 an instrument usu. in the form of a half-circle, used for measuring and drawing angles

SILVA(シルバ)とは、ラテン語で「森」を意味しています。その名の通り、 最も信頼できる「森のコンパス」として、広く世界のスカウト、レンジャー、 森林関係者に愛用され、主要国軍の標準品にも指定されています。(スウェー デン)

シルバは単なるメーカー名ですが、精度や信頼性などにおいて、登山でコン パスと言えば、シルバを思い浮かべるくらい有名です。

平行誤差

地図上で現在位置と目標位置が分かっているとする。現在位置と目標位置を 結ぶ直線(直行線)と磁北線の間の角度を計算しておく。現在位置と目標位置 の間に直行路があれば磁北と常に一定の角度で進めば目標位置にゴールでき る。普通は二点を結ぶ直行路はなく迂回路を辿らなければなならない。二点 間に川が流れていて橋を渡らなければならないためかなり遠回りになったり する。

出発時は直行方向とは左右いずれかにズレた方向に進むのが普通である。 しばらく直行から外れた方向に進むと直行線との平行線上に移動することにな る。以後直行線方向に進み続けるとゴール地点からは離れた直行線に平行な直 線上の点に到達する。最初に直行線から離れた平行線上に移った距離だけ目標 地点から外れる。

そうならないためには左に偏向して進んだら、次は右に偏向して平行誤差を 打ち消す。もし平行誤差以上に移動して直行線を横切ってしまったら再び左 に偏向する。そのように直行線に対してジグザグに進むことになるかもしれ ない。

直行線の左側にいるか右側にいるかを判定する手段はない。ここらへんは 山勘になる。不安なら地図上で確認できる第二の現在位置から目標方向を再度 見直すしかない。

出発地点を中心にして目標地点までを半径とする目標側半円内に現在地があ るなら直行線方向から左右への偏向角度は90度を越えない。この半円を大き く踏み出して行きすぎたら90度を越える方向に逆戻りすることもありうる。

土地勘のある場所で使ってみる

シルバ・コンパスを初めて使ったのは七区の干拓竣功碑からの帰り道であっ た。出発地から目標はほぼ西北西にある。シルバ・コンパスは、コンパス自 体も透明だから地図上の現在地の上に磁針の中心を置くことができる。そう して透明プレートの矢印を目的地に向ける。その状態で磁針カプセルの底に ある矢印を地図の北側に合せる。地図の真北より磁北は西偏5~9度くらいな ので地図の縦方向より左周りに7度くらい傾ける。

これでシルバ・コンパスは準備完了である。磁針カプセルのダイヤルは以後 動かさないようにする。コンパス底面の矢印と磁針の北方向が重なるように シルバ・コンパス全体を回転させる。そのときプレート上の矢印が指し示す 方向が目標方向になる。

単なる丸型のコンパスの場合は北から時計周りにとった方位角を憶える必要 がある。シルバ・コンパスならコンパス底面の矢印と磁針の方向が一致する ようにコンパス全体を廻してプレートの矢印方向に進めばよい。方位角度が 何度であるかを憶えなくてよい。

出発地と目的地の間を蛇行して斜め方向に横切る倉敷川がある。どこかで橋 を渡らなければならない。また大略は碁盤の目状の道路網が、現在地と目的 地間の直行線と45度位の角度で傾いている。どうしても迂回路になる。出発 点から直行線方向より左に偏向して進む。これで生じる平行誤差をとり戻す には後半で右に偏向するはずである。そう思いながら自転車を走らせる途中 で胸ポケットからシルバ・コンパスを取り出してみる。

帰宅直前にはシルバ・コンパスの指し示す方角より右に90度を越えた方向に 進むまでになる。どうやら目的地を通り過ぎ気味になったのだと気付く。振 り返ってみれば当たり前のことなのであるが実際に体験して実感できたとい う鈍さである。

シルバ・コンパスに助けられる

次はシルバ・コンパスに助けられることを経験する。あけぼの公園にある石 碑を見に行こうとする。車を使う道を自転車では通らない。車道脇にある歩 道を延々と進むのはくたびれる。ほとんど車の通らない並木の木陰道を見つ けたりする。手前の労災病院を目指せばその近くになる。病院脇に到達した が、さてこれからどちらに進めばよいのだろう。

街中では見通しが効かない。その代りに電柱とか塀の隅などに町名番地の表 示がある。街中の民家は南向きとは限らない。大きな通りでなければ何処に つながる道なのか見当がつかない。方向感覚の鋭い人なら迷わないだろうが 同じような住宅の並びばかりで見当を失う。

田園地帯は遠くまで見えるが文字表示がまったくない。大きな通りに出てキョ ロキョロしながら地図に載ってそうな建物とか川とかを探して見当をつける。

福南中学の前を通ったので自転車を止めリュックサックから地図を取り出す。 中学校からあけぼの町中央辺りを目標にしてシルバ・コンパスをセットする。 今、福南中学校のどの四隅に居るかなんてことは考えない。敷地の真ん中に 居るとして、あけぼの町の真ん中方向をセットする。

あとはコンパスの指し示す方向から左右90度を越えないようなできるだけ角 度差の少ない方向に向う道を選んで進む。GPSナビゲーションのように道路 を表示してくれないが目的地に向う一般方向が分かることは心強い。住宅街 のゴチャゴチャに目を奪われて方向感覚を失っている人間にとっては、凡そ こちらに進めというだけで十分役にたつ。

気がついたら電柱にあけぼの町の表示がある。田園地帯と違って街中は狭い から辺リをウロウロすれば目的地に届く。幸いなことに進んでいた通りの脇 にあった。

石碑を見学したあと児島湾締切堤防に向うことにする。このときもあけぼ の公園を現在地に、堤防のたもとを目的地に地図上でシルバ・コンパスをセッ トする。地図で途中の経路を見てはいるが全部を漏れなく頭に刻み込む知的能 力と時間の余裕はない。ザッと見ただけで出発する。あとはシルバ・コンパス を見ながら直行線と角度差の少ない方向の道を選んで進む。

途中に中央卸売市場があった。地図を取り出して見たときにはその存在に気 付いてない。地図には似たような通りが幾つもあって自分がそのどれを進ん でいるかまで確認できない。その度に背中のリュックサックから地図を取り 出してはいられない。そこでシルバ・コンパスが示す一般方向だけを頼りに 進む。守備よく堤防へ向う道路に出ることができた。

シルバ・コンパスに頼りきるのではなく補助手段とする。地図を見て標識を 見て、山勘も入れて総合的に判断する。交差点を真っ直ぐ進むべきか曲るか と迷ったときにコンパスを参考にする。もっとも控え目には目標から遠ざか らない方向を教えてくれるものがシルバ・コンパスと考える。

| | コメント (0) | トラックバック (0)

2009年9月 1日 (火)

改行と折り返し

テキストエディターとワードプロセッサーの違い

Time-stamp: "Wed Jul 22 11:37:08 JST 2009"

テキストエディターとワードプロセッサーとの最も大きな違いは何であろう か。これらのソフトウェアが成果物の印刷を重視しているか、あるいは印刷 を軽視もしくは無視しているかにある。

ワードプロセッサーでは成果物を印刷する用紙の大きさを初めにセットす る。用紙サイズは編集後に変更できるが見掛けを調整する必要があるだろ う。

テキストエディターには印刷用紙サイズの設定がないこともある。エディタ に印刷機能が付いているなら用紙サイズの設定はある。私の常用するmeadow は印刷機能を持たないらしい。印刷するには他のテキストエディタかテキス トファイル印刷専用ユーティリティーを使う。

テキストエディターは一行に何文字でも書ける。極端には百文字でも二百文 字でも書ける。そうなると一行全部を画面には表示できない。画面を横スク ロールさせるか画面右端で折り返してその下に表示する。そのまま印刷する と横幅の制限範囲を超える部分は用紙外に印刷することになり結局印字され ない。

テキストエディターの一行は何文字であってもよいとはいっても画面に表示 したり用紙に印刷したりを考えると一行に収容する文字数の目安があって欲 しい。まったく自由なのだと言われると、はて何文字にしようかと悩む。

標準は一行が半角文字で八十字とする。これは初期のディスプレイが一行八 十文字までしか表示できなかったことからきているという。日本語全角文字 なら一行が四十文字になる。

手元にある何冊かの本の一行文字数を数えてみると大体四十字前後になって いる。やはりこの文字数に目が慣れている。この近辺を採用するのが無難な 選択になる。

ワードプロセッサーは、たぶん編集のはじめに用紙の大きさ、一行の横幅や 文字の大きさを決める。ここでも結局は一行あたりの文字数に突き当たる。 一行文字数優先で設定するか、または印刷面横幅からの逆算で文字数が決まっ てくる。どちらにしても目安となる一行文字数は必要になる。

改行と折り返し

ワードプロセッサーで文書をつくる際に書式設定をしない場合は一行文字数 が四十字くらいで用紙サイズがA4という無難な設定でスタートする。行頭か ら入力してゆき行末に到達すると自動的に次の文字は一つ下の行の行頭に配 置される。ワープロのユーザーは現在どこに文字が配置されているかを意識 する必要はない。キーボードからどんどん打ち込んでいけばよい。行末に達 したら次の文字を次行の行頭に自動的に送る機能を「折り返し」という。折 り返し点に標識となるようなものは挿入されない。

段落換えで、(たぶん行の途中で)行換えしたい場合はその場所でリターン キーを押す。この処理を「改行」という。このときは改行コードという標識 が挿入されてカーソルは次行の行頭に移る。行の途中で改行コードという標 識を入れて強制的に次の行に移るのが改行であり、画面右端に到達したら自 動的に次行に移るのが折り返しである。

さて一行四十文字の書式設定で打ち込んだ後に設定変更して一行三十字にし たとする。このときワープロは自動的に一行三十文字に並べ換えをする。四 十字毎に標識が入っているわけではないので最初の設定に引きずられること はない。改行には明確な標識が挿入されているので新しい設定に変えても行 換えを忘れることはない。

テキストエディターによるテキストファイルの行末にはすべて改行コードが 入っている。画面の中央付近であろうが画面右端であろうが次の行に移る場 所には必ず改行の標識が入る。

テキストエディターに行の折り返し機能はない。一行四十字を目安にしてそ の近辺になったらエンターキーを押して改行コードを入力する。このことは エディターのユーザーにとって負担になる。そこでワープロに近い機能が後 付けとして提供されている。

私が普段(というか文章を書くには常に使う)エディターであるmeadowやvim には自動詰め込み編集の機能がある。設定した一行文字数に到達するとリ ターンキーを押さなくても自動的に改行コードを挿入してカーソルを次の行 の行頭に送る。

編集作業で行に書き加えるとか一部を削り取ると行の長さは四十文字ではな くなる。これをワープロのように自動折り返しで整形する機能はない。行末 には必ず改行コードがあるので自由がきかない。この場合には段落整形コマ ンドを使って改行コードの位置を変更して一行四十文字に詰め込むことがで きる。

meadowの自動詰め込みに関する情報は多いが、vimでの情報は少ない。私の 書いたものですが次をご覧ください。

なお、自動詰め込みでネット検索するとmeadow記事が多い。vimの場合は自 動折り返しと言ったほうがよいらしい。

| | コメント (0) | トラックバック (0)

« 2009年8月 | トップページ | 2009年10月 »