接続数

COUNTER438602FROM 2011/6/1

作業診断日誌(process assessment diary)

作業診断試行 >> Article details

2019/08/22

自然言語処理 文章評価 短歌連作

Tweet ThisSend to Facebook | by kaizen

自然言語処理 文章評価 短歌連作

自然言語処理

自然言語処理で、

要約を作る場合と、説明書を作る場合と、挨拶文を作る場合と、短歌連作を作る場合で、評価基準は異なるかもしれない。

それぞれに似た機能があるとよい場合と、真逆の機能が必要な場合があるかもしれない。

例えば、要約の機能で、三十一文字に制約すれば、短歌自動生成になるかもしれない。

挨拶文も、説明書も、特定の知識を前提としない人が対象の場合には、わかりやすさの基準が同じかもしれない。

いろいろな評価視点を確かめて行くと、他の用途でも用いられるかもしれない。

短歌連作を自動生成した場合の、推敲プログラムを作るための仕様を検討する。

連作の個数は、2から1,048,576とする。この上限は、人間が一生の間に作成した短歌が100,000くらいが多い人らしいので、その一桁上までは対応することにする。

つまり、人一生分を超える作品で、なおかつ、人よりも価値のある作品を生成しないと機械でやる意味がない。人ができないことを、やるのが機械なのだから。

評価関数

同じ用語の出現頻度、出現類型

全体で同じ用語が出てくる場合と全体の半分以上で同じ用語がでてくる場合は、特別な計算が必要かもしれない。

似た概念の出現頻度、出現類型

似た表現の出現頻度、出現類型

評価数

全く同じものの並び替えは、作品数が2であれば2通り。
3であれば、6通り。
4であれば、24通り。
5であれば、120通り。
6であれば、720通り。
7であれば、5040通り。
8であれば、40320通り。
9であれば、362880通り。
10であれば、3628800通り。
飛躍的に増えて行く。

人手だと、6以上だと事実上不可能。
1週間くらいかければ、6か7に対応できるかどうか。

計算機で評価関数が作ってあれば、すくなくとも計算はできる。
ひょっとしたら、1,048,576個だと自動生成はできても、評価が1年で終わらないかもしれない。

時系列評価

どの順番だと評価が高いかを研鑽する。

自動修正

一部の語を置き換えたり、置き直した語を含んだものの前後の順番を変えた場合に、評価が高くなるようであれば、途中で自動修正をする機能をつけるかどうかが設計上の課題。

途中で修正すると、永久に評価がを終わらなくなるかどうかの判定が必要になるかもしれない。

それならいっそ、評価だけして、その後に自動修正して評価しなおした方がいいかもしれない。

記録として必要な記述、無駄な記述

ドットインストールのRuby on Rails 5 入門を履修する際に自身が体験したエラーの一例集
https://qiita.com/fleatama/items/34e90e3a96a4cb7a9812

基本的に日本語で書いている文章はほとんどいらない。

入力、画面の記録が欲しい。

運用系の仕事をしている会社では、お客さんに日本語で説明するとお金をくれ、
入力、出力の画面を見せても満足してくれないことがある。

日本語で説明することが仕事になり、実際に計算機を操作していることが仕事ではなくなっている可能性がある。

記録として必要な記述が何かを考察

正常動作編

7までは特にこれといったトラブルも無く来れた

何を入力し、何が出力されたのかの記録がない。

トラブルがなかったのか、何もしなかったかの違いがわからない。

何を入力しろと指示があり、何を入力したか。
何が出力されると予定があり、何が出力されたか。

他に隠れたエラーがなかったか、どうやってたしかめたのか。

これといったトラブルがないという根拠を何も記述していない。

トラブルに気がつかなかったことと、トラブルがないことの区別がない。

正常動作の記録がなければ、異常動作の記録を見てもわからない。

正常動作の時に、異常がなかったか、どう調べたかどうかの記録がないと、異常の時にしらべたことの違いがわからない。

サーバーを立ち上げ、ブラウザにRuby on Railsのサイトを192.168.33.XXで表示するところまでは問題無くこなすことが出来た

サーバーを立ち上げた時の入力はなにか。
ブラウザは一つのブラウザだけで確かめたのか、3種類異常のブラウザで確かめたのか。
表示はどういう表示が予定していて、どういう表示が出たのか。

「問題無く」というのは、どういう問題がないと言っているのか。
すでに潜在的な問題が発生していない根拠は何か。
wiresharkでパケットを取得し分析しているか。

異常動作編

末尾に/postを付けて出来たブログにアクセスしようとしても全く出来なかったのです。

「全く」
何をもって全くと言っているのか。


12:10 | Impressed! | Voted(0) | Comment(0)

アンケート

新規アンケート1
Question 1:
複雑なソフトウェアの設計、試験に必要な技術はなんだと思いますか。

Question 2:
あなたの仕事に関係のある国際規格はなんですか。

Question 3:
プロセスアセスメントに必要な基礎技術は何だと思いますか。

Question 4:
上記1から3でその他とお答えいただいた方と、それ以外に何かご要望、ご質問がある方は、ここにおかきください。

Todo

There is no task registered.