readme_Q042-7_20200331.txt --------------------------------------------  Q042-7 においをかぐ(前部分)(85図)  1.LAJDB 原カード画像データベース    LAJDB_Q042-7_RUN_PUB01.zip   ランタイム版                      zip形式圧縮ファイル     圧縮ファイルの内容:       lajdb_q042-7_lx01_b01V2.USR      <= メインのデータベースファイ       wformQ042-7_lx01V1.USR         <= (語形)       lajp_ken2.USR               <= (県名)       item_all_V2.USR              <= (項目名)        LAJDB_Q042-7_RUN_PUB01.exe      <= ランタイムアプリケーション   *zip形式で圧縮してあります。解凍して利用してください。   *データベースを見るには,別途にデータベースのソフトは必要ありません。    ランタイムアプリケーションのファイルをクリックして,データベースを起動してください。    動作環境:WindowsXP以降の環境         (WindowsXP, Windows7, Windows10上で動作確認)  2.LAJDB エクセルファイル   (1)laj_q042-7_b01-01b.xls  エクセルファイル 形式1                    各地点の回答が1レコードになっている形式   (2)laj_q042-7_b01-01b2.xls  エクセルファイル 形式2                    各地点の各回答語形ごとに1レコードになっている形式   *エクセルファイルは圧縮してありません。  3.内容に関する注  (1)カードの整理番号の系列が複数ある。(このデータは系列7)     項目 Q042 は前部分(85図)と後部分(86図)の2枚の地図がある。     前部分(85図は整理番号の系列7,後部分(86図)は系列8に対応している。     それぞれを1項目相当として,扱う。     なお,系列2のスタンプもあるが,系列2は下書きの段階であり,今回の処理対象     から外してある。     このデータは系列7,前部分(85図)である。     Q042 の 系列7のデータを Q042-7 と表すことにする。  (2)カード連番に欠番あり。     スキャン作業時に重複したり,連番付与を飛ばしたり,あるいは,別の系列の山カードなどのケースによる欠番。     下記の欠番はデータに問題を生じない。     語彙カードのカード連番の欠番      0041,0496,0536      山カードのカード連番の欠番      0001,0004,0005      0006〜0176(<= これらは系列8の山カード。系列7はなし。)  (3)山カードの凡例語形の表記と地図上の凡例語形が相違するケース      ・ハイフン(ダッシュ)の記入が,山カードと一致しないケースあり。       配列順ソートで分類される語彙カードを確認の上,凡例語形は地図画像の凡例に合わせた。      ・語形が異なるケースあり。       配列順ソートで分類される語彙カードを確認の上,凡例語形は地図画像の凡例に合わせた。      個々には,画像データベース上の備考欄に記入。  (4)分類される語彙カードがない山カードあり。(1件)      0460.042.9999.99.7.0169.h0.jpg  NIOIO−,KAZAO−      この山カードの次は,別の凡例語形「KAZA−,NIOIO−」の山カードになっていて,      その先に「0458.042.9999.99.7.0163.h0.jpg  NIOIO−,KAZAO−」として,再度      こんどは,分類される語彙カードのある山カードがある。      この「0460.042.9999.99.7.0169.h0.jpg  NIOIO−,KAZAO−」は,語彙カードの分類上      悪さはしないので,このままの位置においておいた。      この山カードは分類をまとめるはずのものだったのか,作業経過は不明だが。  (5)同じ凡例語形の山カードが複数あるケース     配列順でソートした場合に語彙カードが正しく分類されることを確認の上,     複数の山カードに同じ凡例語形を凡例語形欄に入力してある。    (同じ凡例語形になる複数の山カードが連続する場合も,離れている場合もある)     エクセルのデータには影響しない。      (6)凡例語形の下位分類あるいはバリエーションに相当する見出しカードの取り扱い    該当する凡例語形の語形を凡例語形欄に入力し,カードをそのまま残した。    (他の項目では,削除した作業上削除したケースもある。readmeに注記。)    エクセルのデータには影響しない。    個々には,画像データベース上の備考欄に記入。  (7)地図画像にスタンプがあるが,カードがなかったケースがあり,ダミーの語彙カードを作成した。    地点番号が抜けていた地点(3地点)について地図画像を確認したところ,スタンプがあるのに,カードのデータのない    1地点(地点番号「2812.96」)について,ダミーの語彙カードを作成した。    地点番号「2812.96」は,85図,86図の両方にスタンプがあるが,カードのデータなし。    この地点にひとつだけ抜けている整理番号「7.1541」を対応させると配列順ソートでこの語彙カードが正しく分類されるので,    このダミーに対応する整理番号と考えられる。    整理番号「7.1541」とし,通し番号は,既存の最大値の後に続ける。「2401」として,ダミーを作成した。    ダミーのファイル名:      2401.042.2812.96.7.1541.h0.jpg      2401.042.2812.96.7.1541.t0.jpg  (8)調査地点2400地点のうちデータになかった地点は2地点(ダミー作成後に残った地点)     3740.29 秋田県     6403.62 島根県     地図画像を確認。地図にスタンプなし。            (9)再スキャンにより再インポートしたファイル     画像データベースにインポートしたファイルは,新規レコードとして追加されるため,     未ソート時に,データベースの末尾に配列されているが,今回は     すべて,もともと末尾に並んでいたカードのため,配列順は変わりなし。     (再スキャンの個々の理由は備考欄に記入。)      0015.042.0897.91.7.2675.h0.jpg      0015.042.0897.91.7.2675.t0.jpg      0024.042.1727.75.7.1817.h0.jpg      0024.042.1727.75.7.1817.t0.jpg      0197.042.9999.99.7.1858.h0.jpg      0197.042.9999.99.7.1858.t0.jpg      0763.042.5646.39.7.2578.hn.jpg      0763.042.5646.39.7.2578.t0.jpg      1613.042.6585.83.7.2260.h0.jpg      1613.042.6585.83.7.2260.t0.jpg      1938.042.7342.12.7.2127.hn.jpg      1938.042.7342.12.7.2127.t0.jpg      2401.042.2812.96.7.1541.h0.jpg  <= ダミーとして追加したレコード      2401.042.2812.96.7.1541.t0.jpg  <= ダミーとして追加したレコード        *個々のケースの対応は備考欄に記入。 (10)凡例語形末尾のハイフン     例語形中のハイフンは澤木のコード化で使用するコードとバッティングするので,半角ハイフンを3個連続させた。 (11)澤木コードの「-」と半角ハイフン3個の連続がつながっているケースが生じている。     「E-」の後に,「---」。結果的にハイフンが4個連続しているので注意。       0240.042.9999.99.7.1495.h0.jpg NIWE----     0241.042.9999.99.7.1496.h0.jpg NIWE---- (12)個々のケースの対応は備考欄に記入。  備考:山カードのカード連番の欠番の記載から「0002」を削除。「0002」はピンクカード。  4.履歴   公開年月日:2020-03-31   2020-03-31   熊谷康雄(国立国語研究所)