Commit e8c3d8e

committed

modify code

1 parent 45fecd3 commit e8c3d8eCopy full SHA for e8c3d8e

File tree

2 files changed

+13

-11

lines changed

seg_lstm.py
test.py

2 files changed

+13

-11

lines changed

`‎seg_lstm.py‎`

Lines changed: 12 additions & 11 deletions

Original file line number	Diff line number	Diff line change
`@@ -23,7 +23,7 @@ def __init__(self):`
`23`	`23`	`self.tag_count = 4`
`24`	`24`	`self.concat_embed_size = self.window_size * self.embed_size`
`25`	`25`	`self.vocab_size = constant.VOCAB_SIZE`
`26`		`- self.alpha = 0.05`
	`26`	`+ self.alpha = 0.1`
`27`	`27`	`self.lam = 0.0001`
`28`	`28`	`self.eta = 0.02`
`29`	`29`	`self.dropout_rate = 0.2`
`@@ -36,13 +36,13 @@ def __init__(self):`
`36`	`36`	`self.sess = tf.Session()`
`37`	`37`	`self.optimizer = tf.train.GradientDescentOptimizer(self.alpha)`
`38`	`38`	`self.x = tf.placeholder(self.dtype, shape=[1, None, self.concat_embed_size])`
`39`		`- self.embeddings = tf.Variable(`
`40`		`- tf.truncated_normal([self.vocab_size, self.embed_size], stddev=-1.0 / math.sqrt(self.embed_size),`
`41`		`- dtype=self.dtype), dtype=self.dtype, name='embeddings')`
	`39`	`+ #self.embeddings = tf.Variable(`
	`40`	`+ # tf.truncated_normal([self.vocab_size, self.embed_size], stddev=-1.0 / math.sqrt(self.embed_size),`
	`41`	`+ # dtype=self.dtype), dtype=self.dtype, name='embeddings')`
	`42`	`+ self.embeddings = tf.Variable(np.load('corpus/lstm/embeddings.npy'), dtype=self.dtype, name='embeddings')`
`42`	`43`	`self.w = tf.Variable(`
`43`	`44`	`tf.truncated_normal([self.tags_count, self.hidden_units], stddev=1.0 / math.sqrt(self.concat_embed_size),`
`44`		`- dtype=self.dtype),`
`45`		`- dtype=self.dtype, name='w')`
	`45`	`+ dtype=self.dtype), dtype=self.dtype, name='w')`
`46`	`46`	`self.b = tf.Variable(tf.zeros([self.tag_count, 1], dtype=self.dtype), dtype=self.dtype, name='b')`
`47`	`47`	`self.A = tf.Variable(tf.random_uniform([self.tag_count, self.tag_count], -0.05, 0.05, dtype=self.dtype),`
`48`	`48`	`dtype=self.dtype, name='A')`
`@@ -53,17 +53,18 @@ def __init__(self):`
`53`	`53`	`self.update_A_op = self.A.assign((1 - self.lam) * (tf.add(self.A, self.alpha * self.Ap)))`
`54`	`54`	`self.update_init_A_op = self.init_A.assign((1 - self.lam) * (tf.add(self.init_A, self.alpha * self.init_Ap)))`
`55`	`55`	`self.sentence_holder = tf.placeholder(tf.int32, shape=[None, self.window_size])`
`56`		`- self.lookup_op = tf.nn.embedding_lookup(self.embeddings, self.sentence_holder)`
	`56`	`+ self.lookup_op = tf.nn.embedding_lookup(self.embeddings, self.sentence_holder).reshape([-1,self.concat_embed_size])`
`57`	`57`	`self.indices = tf.placeholder(tf.int32, shape=[None, 2])`
`58`	`58`	`self.shape = tf.placeholder(tf.int32, shape=[2])`
`59`	`59`	`self.values = tf.placeholder(self.dtype, shape=[None])`
`60`	`60`	`self.map_matrix_op = tf.sparse_to_dense(self.indices, self.shape, self.values, validate_indices=False)`
`61`	`61`	`self.map_matrix = tf.placeholder(self.dtype, shape=[self.tag_count, None])`
`62`	`62`	`self.lstm = tf.contrib.rnn.LSTMCell(self.hidden_units)`
`63`	`63`	`self.lstm_output, self.lstm_out_state = tf.nn.dynamic_rnn(self.lstm, self.x, dtype=self.dtype)`
	`64`	`+ #self.lstm_output, self.lstm_out_state = tf.nn.dynamic_rnn(self.lstm, self.x, dtype=self.dtype)`
`64`	`65`	`tf.global_variables_initializer().run(session=self.sess)`
`65`	`66`	`self.word_scores = tf.matmul(self.w, tf.transpose(self.lstm_output[0])) + self.b`
`66`		`- self.loss_scores = tf.multiply(self.map_matrix, self.word_scores)`
	`67`	`+ self.loss_scores = tf.reduce_sum(tf.multiply(self.map_matrix, self.word_scores),0)`
`67`	`68`	`self.loss = tf.reduce_sum(self.loss_scores)`
`68`	`69`	`self.lstm_variable = [v for v in tf.global_variables() if v.name.startswith('rnn')]`
`69`	`70`	`self.params = [self.w, self.b] + self.lstm_variable`
`@@ -72,9 +73,8 @@ def __init__(self):`
`72`	`73`	`self.embedp = tf.placeholder(self.dtype, shape=[None, self.embed_size])`
`73`	`74`	`self.embed_index = tf.placeholder(tf.int32, shape=[None])`
`74`	`75`	`self.update_embed_op = tf.scatter_update(self.embeddings, self.embed_index, self.embedp)`
`75`		`- self.sentence_length = 1`
`76`	`76`	`self.sentence_index = 0`
`77`		`- self.grad_embed = tf.gradients(self.loss_scores[:, self.sentence_index], self.x)`
	`77`	`+ self.grad_embed = tf.gradients(self.loss_scores[self.sentence_index], self.x)`
`78`	`78`	`self.saver = tf.train.Saver(self.params + [self.embeddings, self.A, self.init_A], max_to_keep=100)`
`79`	`79`
`80`	`80`	`def model(self, embeds):`
`@@ -123,6 +123,7 @@ def train_sentence(self, sentence, tags, length):`
`123`	`123`	`feed_dict={self.x: np.expand_dims(sentence_embeds, 0), self.map_matrix: sentence_matrix})`
`124`	`124`	`self.sess.run(self.regularization)`
`125`	`125`
	`126`	`+ '''`
`126`	`127`	`# 更新词向量`
`127`	`128`	`self.sentence_length = length`
`128`	`129`
`@@ -136,7 +137,7 @@ def train_sentence(self, sentence, tags, length):`
`136`	`137`	`feed_dict={`
`137`	`138`	`self.embedp: sentence_update_embed.reshape([self.window_size, self.embed_size]),`
`138`	`139`	`self.embed_index: sentence[index]})`
`139`		`-`
	`140`	`+ '''`
`140`	`141`	`# 更新转移矩阵`
`141`	`142`	`A_update, init_A_update, update_init = self.gen_update_A(tags, current_tags)`
`142`	`143`	`if update_init:`

`‎test.py‎`

Lines changed: 1 addition & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -31,6 +31,7 @@ def test_seg_dnn():`
`31`	`31`	`#print(seg.seg('小明来自南京师范大学'))`
`32`	`32`	`#print(seg.seg('小明是上海理工大学的学生'))`
`33`	`33`	`print(seg.seg('小明来自南京师范大学'))`
	`34`	`+ print(seg.seg('小明是上海理工大学的学生'))`
`34`	`35`	`test(seg,'tmp/lstm-model0.ckpt')`
`35`	`36`	`# print(seq)`
`36`	`37`	`# cal_val(seq)`

0 commit comments

Comments

(0)

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit e8c3d8e

File tree

2 files changed

2 files changed

`‎seg_lstm.py‎`

`‎test.py‎`

0 commit comments