お客様のニーズに合わせて開発する『カスタムメイド』辞書
・社内用語、業界用語、方言などの辞書がほしい
・いつも現場で使っている言葉で検索をしたい
そんな要望がございましたら、是非ご相談ください。必要な分野の専門家が、お客様のニーズに合致した辞書を開発いたします。
辞書開発のフロー
STEP1 用語の収集 | 〈1〉 用語の採択(既存辞書ツールより) 〈2〉 用語の切り出しとマイニング(論文・書籍より) |
STEP2 用語の整理 | 〈3〉 重複語整理(頻度集計) 〈4〉 不要語排除 |
STEP3 辞書の設計 | 〈5〉 用語カテゴリーの種類 〈6〉 階層の範囲 |
STEP4 用語の分析 | 〈7〉 階層ツリーの設定 〈8〉 同義語・関連語のリンク付け |
STEP5 辞書の編集 | 〈9〉 用語コードの付与・重複語整理(頻度集計) 〈10〉用語リンクの展開(論理チェック) |
要件
ケース・バイ・ケースで用途やご希望に合わせて開発いたします。参照語の種類やその選定基準の厳しさ、元データの有無やその状態、階層構造の有無、対訳英語データの有無、語数と用語の範囲などを主な基準にしてお見積いたします。
参照後の種類
見出し語(実際に検索されるインデックスとなる用語)から参照される用語には、表記ゆれ語、略語、同義語、関連語、広義語(上位語)、狭義語(下位語)があります。種類が多く、作業に手間がかかるものほどコストが大きくなります。
元データの有無と状態
元になるデータがある場合、調査などが不必要になるためコストは下がります。データがない場合でも開発は可能です。また、元になるデータがカテゴリー分けされた電子用語集などのように、そのまま用語の整理に使用できる場合、文書から用語を拾い上げる場合よりもかなり低コストになります。元データが電子文書や紙文書で存在する場合もご相談ください。
階層の有無と深さ
上位語、下位語などの言葉の階層をもつ完全なシソーラス構造の辞書を使用すると、検索の精度はあがりますが、開発コストはかさみます。これは、構造の設計や構築、論理性チェックなどに技術と工数が必要とされるためです。
対訳英語の有無
コストの調整が必要である場合、語数や必要な用語の範囲を限定することでもある程度対応が可能です。仕様検討時にご相談ください。
語数と範囲
お客様がお持ちのデータに対訳英語がついているかどうか、また、対訳英語をつける必要があるかどうかによってもコストは変わります。対訳英語については、仕様によってお客様のコストが増減いたします。詳しくはご相談ください。
お見積り
お客様のご要望や検索要件にあわせて、ご相談の後、お見積いたします。
→見積もり例: 500円~800円/1ワードグループ*+調査料・データ加工料など
*ワードグループ…見出し語(中心となる言葉、インデックス)と参照語を含む用語のグループ
<上記見積もりの要件整理例>
・元データあり(電子文書
・階層無し
・参照語は同義語のみ
・対訳英語一部付与済み