swriter.exe - 超代筆君 MEGA-Mix
 Copyright (c) YumemiYougie-Project

 


誤植チェック

 テキストファイルの誤植を検索し、リストアップする機能です。

予めリストアップしてある誤植の可能性の高い単語と照会してリストアップするだけの簡単機能ですが、実際使うと結構出てくるのでぜひお試し下さい。

また、以降出した誤植を随時追加していく事でより精度が高くなり、自身の起こしやすいミスをよりフォローしてくれるようになります。

小説/ノベル用 

手順

まだサンプルをダウンロードしていない場合は、ダウンロードページから「チュートリアルサンプル」をダウンロード。

checktxt フォルダを開きます。

text フォルダにサンプルテキストが入ってます。
ここに試しに適当なファイルを追加してみるのもよいでしょう。

 


checktxt.swb

バッチファイルを実行します。

 

実行結果 (typoslist.txt は更新されるため若干相違する場合があリます)

C言語注釈を除外
C TEXT\nr_day01.txt(135): 3年前の事故で両親と視力を失った俺を高校中退して養ってくれている健気な人。 ←倫理警告の可能性"高校"を含む
B TEXT\nr_day01.txt(686): 今となっては前時代の産物さ。帝国主義の亡霊共が現代に残した狂気だ。 ←禁止語句の可能性"狂気"を含む
B TEXT\nr_day02.txt(362): 品の良いナチス帝国か・・・。なんか妙に居心地がいいな。 ←禁止語句の可能性"ナチス"を含む
A TEXT\nr_day02.txt(677): さて、少しづつ不確定要素を埋めて行くとするかね。 ←誤植の可能性"しづつ"を含む
A TEXT\nr_day03.txt(55): \cls「わたし? わたしは吹奏楽部だよ。やまざきくんもやってみる、楽器なら目が見えなくても・・・・!!、ごめんなさい」 ←誤植の可能性"!、"を含む
3 TEXT\nr_day05.txt(373): 「ああ、それじゃ、 ←「」の数が合っていない
1 TEXT\nr_day05.txt(373): 「ああ、それじゃ、 ←末尾が、で終っている
3 TEXT\nr_day05.txt(379): ・・・俺はこれで」 ←'「'で始まっていない'」'
2 TEXT\nr_day05.txt(455): ★SPに襲われ ←注釈記号抜けの可能性
2 TEXT\nr_day05.txt(640): ☆#%!〜 ←注釈記号抜けの可能性
2 TEXT\nr_day08.txt(772): ★学園俳諧 ←注釈記号抜けの可能性
Completed...

内蔵機能としてのチェック内容は
  「括弧の数が合わない」
  「。なし等」
  「記号が冒頭に来ている(注釈抜け)」
です。

これらは不要であればバッチファイルに指定するパラメータで規制する事ができます。

パラメータ '-'に続けてパラメータを指定します。(複数指定可)
  c C言語注釈を除外する
  a アセンブラ注釈を除外する
  p Perl注釈を除外する
  w? lv? 以下のワーニングメッセージを表示しない

ワーニングレベル
  lv0 文末のエラー 末尾が。で終っていない
  lv1 文末のエラー 末尾が、で終っている
  lv2 注釈抜けの可能性
  lv3 括弧の数が合わない

 

誤植、禁止語句は外部ファイルで定義されています。


typoslist.txt

バッチファイルで指定されています。

用途、種別によってファイルを呼び分ける事が出来ます。

 

リストファイル typoslist.txt 一部

STRING=誤植
、」
、。
。、
、、
。。
?、
!、
?。
!。
にに
ぬぬ
るる
ののの
ままま
喉乾
喉が乾
口が乾
的を得
砂荒らし
だなな
とづつ
しづつ
少づつ

STRING=倫理警告
学校
高校
女子高生
女子大生
十字架
六芒星
タバコ

これらと文中を照会して誤植を検索しています。

新たな誤植が発見された場合、これに追加していけば、より精度の高いフィルターとなります。

STRING=倫理警告

などのカテゴリーも自分で増やせるので用途に合わせ、カスタマイズして下さい。

照会はスペース、改行、タブを無視して行います。テキスト中、他のツールによって単語の途中で改行が加わった場合でもリストアップされます。

 

正規表現もどき

 リストファイルには正規表現の [] [^] のみ使う事ができます。

[とし少]づつ

とづつ
しづつ
少づつ

と同じ意味です。

にに[^っこ]

は 「〜にに入る」 には反応しますが「〜ににっこり」「〜ににこり」には反応しなくなります。

これらはリストの数を軽減したり、弾かれる物が多くなりすぎる場合に使用するためのもので、

経験上リストにはできるだけ反応範囲の多い物を記述し、リストされた結果を後から整理する方が、誤植をなくしやすくなります。

 

 

処理結果の行の頭にエラー種別の記号がついています。

C言語注釈を除外
C TEXT\nr_day01.txt(135): 3年前の事故で両親と視力を失った俺を高校中退して養ってくれている健気な人。 ←倫理警告の可能性"高校"を含む
B TEXT\nr_day01.txt(686): 今となっては前時代の産物さ。帝国主義の亡霊共が現代に残した狂気だ。 ←禁止語句の可能性"狂気"を含む
B TEXT\nr_day02.txt(362): 品の良いナチス帝国か・・・。なんか妙に居心地がいいな。 ←禁止語句の可能性"ナチス"を含む
A TEXT\nr_day02.txt(677): さて、少しづつ不確定要素を埋めて行くとするかね。 ←誤植の可能性"しづつ"を含む
A TEXT\nr_day03.txt(55): \cls「わたし? わたしは吹奏楽部だよ。やまざきくんもやってみる、楽器なら目が見えなくても・・・・!!、ごめんなさい」 ←誤植の可能性"!、"を含む
3 TEXT\nr_day05.txt(373): 「ああ、それじゃ、 ←「」の数が合っていない
1 TEXT\nr_day05.txt(373): 「ああ、それじゃ、 ←末尾が、で終っている
3 TEXT\nr_day05.txt(379): ・・・俺はこれで」 ←'「'で始まっていない'」'
2 TEXT\nr_day05.txt(455): ★SPに襲われ ←注釈記号抜けの可能性
2 TEXT\nr_day05.txt(640): ☆#%!〜 ←注釈記号抜けの可能性
2 TEXT\nr_day08.txt(772): ★学園俳諧 ←注釈記号抜けの可能性
Completed...

ワンタッチ機能にある「リストソート」に結果のテキストを通すとエラーの種類ごとに並べ替える事が出来ます。

 

Grep検索リスト 一括変換反映ツール「ListReput」を使えば、このテキストファイルを直接書き換えるだけで元のファイルに反映させる事ができます。