フロッピーディスクドライブもない、インターネットにも接続できない。そんな超古いラップトップに保存された音声データを取り出したいと依頼を受けた、あるエンジニア。最終的に取り出すことに成功したのだが、一体どうやって?
かつて使っていた古いラップトップからデータを取り出したい。そんな場合、記憶媒体を使ったりインターネット経由でデータを送ったりすれば、難しいことではない。
だが、それはトンデモなく古く、USBポートもなければフロッピーディスクドライブもない。HDDは取り出せないしインターネットにも接続できない……と八方塞がりの場合はどうしたらよいのか。そんな状況の中で「FAX」を使ってデータの取り出しに成功したという、あるソフトウェアエンジニアの奮闘が話題になっている。一体、どうしたらFAXで古いデータを取り出せるのか?
ソフトウェアエンジニアのルーク氏は、ある時、家族から「古いラップトップに保存した古い音声ファイルを取り出して、今使っているPCで聞きたい」との依頼を受けた。一見すると簡単そうな依頼のような気もするが、そうでもなかった。
ルーク氏はこの一部始終を「How to Copy a File From a 30-year-old Laptop」というタイトルで自身のブログに掲載した。そして、このブログ記事がソーシャルニュースサイト「Hacker News」などで取り上げられ、多くのコメントが寄せられた。
ブログ記事によれば、「古いラップトップ」というのが最大の難関だったという。それは1994年製の「PowerBook Duo 280c」で、音声ファイルも内蔵スピーカーで再生できるものの、出力端子が存在しないためアナログコピーを取り出すことは不可能だった。ルーク氏はなんとかデジタルコピーを取りたいと考えた。
内蔵HDDは特殊な形状のSCSI接続でファイルシステムはHFS(Hierarchical File System)と、取り出して中身にアクセスすることも難しい仕様だ。内蔵FDDは原因不明の故障で動作しない。「AppleTalk」ポートとモジュラージャックがあったが、ネットワークソフトやダイヤルアップアプリはインストールされていない。そもそもPowerBook Duo 280cはインターネットが普及する以前の製品でHTTPプロトコルにも対応していないため、たとえダイヤルアップ接続したとしても、インターネット接続できる可能性は皆無だった。
そんな困難の中、ルーク氏が目を付けたのがPowerBook Duo 280cにインストールされていた「FAXソフト」だった。音声データをFAXで送れる形式にすれば、外部に送信してデジタルデータとして持ち出せると考えた。
ルーク氏は、懐かしい「ResEdit」にも着目した。ResEditの16進エディタを使って音声ファイルを16進数のテキストへ変換した。ResEditは印刷機能がなかったので、これを「Microsoft Word」にコピーして文書化することにした。
音声ファイルのサイズは3万7928B。つまり、38KBほどのサイズだ。これを16進数へ変換して文字化すると各バイトが2文字で表されるため、文字数はその2倍になる。しかし、PowerBook Duo 280cのクリップボードにコピーできる文字数は最大3万2000文字のため、複数回のコピー&ペースト作業が必要になった。
数回に分けて音声データを16進数の文字化に成功したら、いよいよFAXソフトで送信するだけだ。だが、送信先が問題となった。ルーク氏はダイヤルアップモデムを内蔵した「ThinkPad T60」を受信先とした。ただ、モジュラーケーブルでPowerBook Duo 280cとThinkPad T60を接続するだけではFAX通信はできない。ThinkPad T60のモデムが正常に動作するためには電話回線から供給される電圧が必要なため、ルーク氏はその装置を自作した。
こうしてようやく文書化された音声ファイルをフォントのサイズなどを調整してFAXで送信したところ、1枚の文書を7分ほどで送信できた。送られた文書はTIFF形式で、今度はこの画像の文字をバイナリファイルに戻す必要がある。ルーク氏はTIFF画像をPDFに、そしてOCR(光学文字認識)技術でテキストデータに変換し、16進数エディタを使って元の音声ファイルに変換した。
復元された音声ファイルは「符号なし8ビットPCM」「サンプリング周波数22050Hz」「リトルエンディアン」「モノラル」であることが判明した。再生してみると非常にいい音で「PowerBook Duo 280cの内蔵マイクで録音されたものだと考えれば、なおさら高音質に感じた」とルーク氏はブログに記した。
だが、再現された音声にはノイズが混ざっていた。ルーク氏はOCRの誤認識が原因だと推測し、誤認識した文字を修正するアプリを開発して徹底的に文字認識の精度を上げた。その結果、PowerBook Duo 280cでテキスト化された音声データの完全復活に成功したのだった。
非常に手間と時間がかかったが、ルーク氏にとってはなかなか楽しい経験だったようだ。
上司X: ものすごく古いラップトップから音声データをFAXソフトで取り出した、という話だよ。
ブラックピット: なんとも、まあ苦労したことで……。
上司X: 音声データをバイナリ化して、それをテキスト化してFAXで送ると……。しかし、ResEditって懐かしいな。
ブラックピット: それを受け取ったら今度はPDF化して、それを文字認識して、バイナリデータを元のファイルに戻すと。
上司X: しかも、文字認識の誤認識を正すアプリまで作っちゃったりしてね。
ブラックピット: でも、ブログを読むに、なんだか楽しんで作業してたみたいですけどね。
上司X: だな。気になるのは、いったいどんな音声ファイルだったのか、ということが語られていないところなんだよな。
ブラックピット: 別にいいじゃないですか。逆にそれを知ってどうするんですか?
上司X: いや、ここまで苦心してどうでもいい音声ファイルだったらそれはそれで面白いかなと思ってね。まあ、そんな俺の興味はともかくだ、今回のルーク氏の取り組みこそ興味深いものじゃないか。ここまで腐心する人も、そういるものじゃないとは思うけどね……。
年齢:36歳(独身)
所属:某企業SE(入社6年目)
昔レーサーに憧れ、夢見ていたが断念した経歴を持つ(中学生の時にゲームセンターのレーシングゲームで全国1位を取り、なんとなく自分ならイケる気がしてしまった)。愛車は黒のスカイライン。憧れはGTR。車とF1観戦が趣味。笑いはもっぱらシュールなネタが好き。
年齢:46歳
所属:某企業システム部長(かなりのITベテラン)
中学生のときに秋葉原のBit-INN(ビットイン)で見たTK-80に魅せられITの世界に入る。以来ITひと筋。もともと車が趣味だったが、ブラックピットの影響で、つい最近F1にはまる。愛車はGTR(でも中古らしい)。人懐っこく、面倒見が良い性格。
Copyright © ITmedia, Inc. All Rights Reserved.
製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。