SF游歩道

語ろう、感電するほどのSFを!

プロフィール

自己紹介

下村思游(しもむら しゆう)

司書、SFレビュアー、SF研究者。

東北大学理学部物理学科卒。

SFファン歴はたぶん10年以上。最初に読んだSFは星新一のショート・ショート集『ボッコちゃん』。

専門は素粒子物理学(高エネルギー物理学)、加速器科学、教育学、日本SF御三家(特に最初期筒井康隆、最初期星新一)、円城塔

使用言語は得意な順に日本語、英語(通訳は不可)、中文(読むことのみ)、独語。

 

過去の仕事

著作

ハヤカワ文庫JA総解説』(早川書房、2022、共著)

書評

ブックガイド

  • 劉慈欣『三体』『三体Ⅱ:黒暗森林』、陳楸帆『荒潮』、郝景芳『郝景芳短篇集』、立原透耶編『時のきざはし』、いずれも《SFマガジン》2020年12月号(特集:中国SF)
  • キム・チョヨプ『わたしたちが光の速さで進めないなら』、大恵和実編『移動迷宮:中国史SF短篇集』、立原透耶『時のきざはし:現代中華SF傑作選』、いずれも《SFマガジン》2022年6月号(特集:アジアSF)
  • 星新一『ボッコちゃん』、円城塔Self-Reference ENGINE』、グレッグ・イーガン『しあわせの理由』、ウィリアム・ギブスン『クローム襲撃』、いずれも《SFマガジン》2023年8月号(特集:SFをつくる新しい力)

全作解題

総解説

エッセイ

メディア出演

  • NHK仙台放送局『てれまさむね』内「みやぎUP-DATE」、2020年11月19日放送分

 

好きな作家

星新一筒井康隆小松左京伊藤計劃円城塔、伴名練、草野原々、小川哲

レイ・ブラッドベリフレドリック・ブラウンジェイムズ・ティプトリー・ジュニアウィリアム・ギブスンテッド・チャングレッグ・イーガンホルヘ・ルイス・ボルヘス、劉慈欣、ケン・リュウ

 

各種連絡先

メールアドレス shiyuu.shimomura_at_gmail.com

Twitter @ss_scifi (下村思游)

御用命はメールにて承ります。

星新一の埋没著作物について : 第1報

星新一公式サイトに記載されていない星新一の著作物を多数発見したので、その一部を第1報としてまとめる。

  • エッセイ「孤島論の一端」
    • 書誌情報
    • 概要
  • 座談会「怒れ!電子計算機」
    • 書誌情報
    • 概要
    • 内容紹介
  • 補記
  • 参考文献
  • 関連書籍
続きを読む

夏目漱石『こころ』の文字頻度解析

前回の円城塔『通信記録保管所』および『花とスキャナー』の文字頻度解析から引き続き、夏目漱石による小説『こころ』の本文テキストに含まれる各文字の出現頻度を調べた。

 

定本として国立国会図書館でデジタル化された『こころ』(岩波書店、1916)を用いた。この本文画像データから国立国会図書館が公開しているOCRソフトNDLOCR ver.2.1を用いて本文テキストデータを作成し、前書き・奥付け・章題など本文でないことが明白な箇所を人力で補正した。

 

結果は下図の通り。

図1 夏目漱石『こころ』の文字の出現頻度

『こころ』についても、Zipf則は見えると言っていいのではないか。

なお、出現頻度の順位を30位まで列挙すると以下の通り。

のたしにはてなつでいをかと私るもがらますれうんりさあゐだくへ

円城塔の出現頻度、

『通信記録保管所』

のいとなるはたてにしでがかうをっもれこらありだそくすまわきん

『花とスキャナー』

いのとなてはるにたしがかをでうっもられこだりそくあんすけまき

と比較して“い”の順位が低くなったのは、”い”と“ゐ”に割れてしまったからだろう。

ちなみに“k”は388回登場し、60位だった。

なお、本研究で用いたテキストデータには記号類の一部(“『”など)や読み取り不可能文字が多数存在するほか、NDLOCR由来の不定性があり、精度に課題が残っていることに注意したい。

今後も引き続き、パブリックドメインとなっている日本語文学作品との比較を行なっていきたい。

 

参考文献・ツール

[1] 夏目漱石, こころ, 岩波書店, 1916, 国立国会図書館デジタルコレクション, 

https://dl.ndl.go.jp/pid/906330

[2] 中村覚, Google Colabを用いたNDLOCRアプリの実行(Google Driveを用いた画像の入力と結果の保存),

https://zenn.dev/nakamura196/articles/a8227f4524570c, 2022

[3] 中村覚, NDLOCR_v2の実行例.ipynb, 

https://colab.research.google.com/github/nakamura196/000_tools/blob/main/NDLOCR_v2%E3%81%AE%E5%AE%9F%E8%A1%8C%E4%BE%8B.ipynb, 2023

円城塔『通信記録保管所』および『花とスキャナー』の文字頻度解析

円城塔による短篇小説集『通信記録保管所』および『花とスキャナー』の本文テキストに含まれる各文字の出現頻度を調べた。

 

結果は下図の通り。なお、縦軸が各文字の出現数、横軸が各文字の出現数の順位を表している。

図1 円城塔『通信記録保管所』の文字の出現頻度

図2 円城塔『花とスキャナー』の文字の出現頻度

“任意の自然言語における単語の出現順位分布は冪乗則に従う”ということが経験的に知られている。これをZipf則といい、単語だけでなく、文字においても同様の結果が得られることが知られている。今回は円城塔がCC BY-NC 4.0で全文を公開している短篇小説集『通信記録保管所』および『花とスキャナー』に対して文字レベルの頻度解析を行った。

図1, 2を見ると、汚いものの確かにZipf則が見えそうな気配がする。『通信記録保管所』が 2000×100 = 10万字、『花とスキャナー』が 10000×4 = 4万字と母集団の大きさが異なるが、母集団が小さい『花とスキャナー』の方がより綺麗にZipf則が見えたのが興味深い。また、どちらも出現する文字の種類は高々10^3のオーダーでしかないことにも注目したい。

なお、出現頻度の順位を30位まで列挙するとそれぞれ以下の通り。

『通信記録保管所』

のいとなるはたてにしでがかうをっもれこらありだそくすまわきん

『花とスキャナー』

いのとなてはるにたしがかをでうっもられこだりそくあんすけまき

28位に出現する“わ”と“け”がそれぞれ交代しているだけで、それ以外の文字は全てかなり近い順位に出現することは非常に興味深い。

2000字のフラッシュフィクションと10000字の短篇では、当然作品の構成が異なることが期待されるが、今回の例においてはその構成の差異を文字の出現頻度という量的な指標から読み取ることは困難であろうと予想される。

円城塔作品だけに対する解析だけでなく、パブリックドメインとなっている夏目漱石芥川龍之介太宰治などの作品における文字頻度解析を行なって日本語の文学作品におけるZipf則の存在の有無や出現頻度順を比較すること、また私自身の文章についても解析を行うことを今後の課題としたい。

 

参考文献

[1] 円城塔, 通信記録保管所, https://github.com/EnJoeToh/stories_2000, 2023

[2] 円城塔, 花とスキャナー, https://github.com/EnJoeToh/stories_10000, 2023

[3] ホイト・ロング, 数の値打ち : グローバル情報化時代に日本文学を読む, フィルムアート社, 2023

[4] 石井大地, 現代のテクスト分析 : その理論と実装, れにくさ : 現代文芸論研究室論集, 5, 1, 44-61, 2014

読書録抜粋21

学部入学以降付けている読書録からの抜粋その21。すべてノートに万年筆で一発書きなので文章はところどころで破綻しているが、それも当時の味ということで。コメントは現在のもの。

  • 2020.11.3 野崎まど『野崎まど劇場』電撃文庫
    • コメント
  • 2020.11.5 野崎まど『野崎まど劇場(笑)』電撃文庫
    • コメント
  • 2020.11.28 小川哲『ユートロニカのこちら側』ハヤカワ文庫JA
    • コメント
  • 2020.11.27 N・K・ジェミシン『第五の季節』創元SF文庫
    • コメント
  • 2020.12.26 フアン・ルルフォ『ペドロ・パラモ』岩波文庫
    • コメント
続きを読む

読書録抜粋20

学部入学以降付けている読書録からの抜粋その20。すべてノートに万年筆で一発書きなので文章はところどころで破綻しているが、それも当時の味ということで。コメントは現在のもの。

続きを読む

読書録抜粋19

学部入学以降付けている読書録からの抜粋その19。すべてノートに万年筆で一発書きなので文章はところどころで破綻しているが、それも当時の味ということで。コメントは現在のもの。

続きを読む

読書録抜粋18

学部入学以降付けている読書録からの抜粋その18。すべてノートに万年筆で一発書きなので文章はところどころで破綻しているが、それも当時の味ということで。コメントは現在のもの。

  • 2020.1.13 ユング・ホルツ『紫色の時差』日本経済新聞社
    • コメント
  • 2020.2.19 オラフ・ステープルドン『最後にして最初の人類』国書刊行会
    • コメント
  • 2020.3.22 マーサ・ウェルズ『マーダーボット・ダイアリー(上)』創元SF文庫
    • コメント
  • 2020.3.23 マーサ・ウェルズ『マーダーボット・ダイアリー(下)』創元SF文庫
    • コメント
  • 2020.4.12 安倍公房『笑う月』新潮文庫
    • コメント
続きを読む

読書録抜粋17

学部入学以降付けている読書録からの抜粋その17。すべてノートに万年筆で一発書きなので文章はところどころで破綻しているが、それも当時の味ということで。コメントは現在のもの。

続きを読む

読書録抜粋16

学部入学以降付けている読書録からの抜粋その16。すべてノートに万年筆で一発書きなので文章はところどころで破綻しているが、それも当時の味ということで。コメントは現在のもの。

続きを読む

読書録抜粋15

学部入学以降付けている読書録からの抜粋その15。すべてノートに万年筆で一発書きなので文章はところどころで破綻しているが、それも当時の味ということで。コメントは現在のもの。

続きを読む