Commit a783f6b

committed

add embedding layer implementation

1 parent f1ba069 commit a783f6bCopy full SHA for a783f6b

File tree

1 file changed

+47

-38

lines changed

seg_lstm.py

1 file changed

+47

-38

lines changed

`‎seg_lstm.py‎`

Lines changed: 47 additions & 38 deletions

Original file line number	Diff line number	Diff line change
`@@ -35,50 +35,57 @@ def __init__(self):`
`35`	`35`	`# 模型定义和初始化`
`36`	`36`	`self.sess = tf.Session()`
`37`	`37`	`self.optimizer = tf.train.GradientDescentOptimizer(self.alpha)`
	`38`	`+ # self.optimizer = tf.train.AdamOptimizer(self.alpha)`
`38`	`39`	`self.x = tf.placeholder(self.dtype, shape=[1, None, self.concat_embed_size])`
`39`		`- #self.embeddings = tf.Variable(`
	`40`	`+ #self.embeddings = tf.Variable(`
`40`	`41`	`# tf.truncated_normal([self.vocab_size, self.embed_size], stddev=-1.0 / math.sqrt(self.embed_size),`
`41`		`- # dtype=self.dtype), dtype=self.dtype, name='embeddings')`
`42`		`- self.embeddings = tf.Variable(np.load('corpus/lstm/embeddings.npy'), dtype=self.dtype, name='embeddings')`
	`42`	`+ # dtype=self.dtype), name='embeddings')`
	`43`	`+ self.embeddings = tf.Variable(`
	`44`	`+ tf.random_uniform([self.vocab_size, self.embed_size], -1.0 / math.sqrt(self.embed_size),`
	`45`	`+ 1.0 / math.sqrt(self.embed_size), dtype=self.dtype), name='embeddings')`
	`46`	`+ # self.embeddings = tf.Variable(np.load('corpus/lstm/embeddings.npy'), dtype=self.dtype, name='embeddings')`
`43`	`47`	`self.w = tf.Variable(`
`44`	`48`	`tf.truncated_normal([self.tags_count, self.hidden_units], stddev=1.0 / math.sqrt(self.concat_embed_size),`
`45`		`- dtype=self.dtype), dtype=self.dtype, name='w')`
`46`		`- self.b = tf.Variable(tf.zeros([self.tag_count, 1], dtype=self.dtype), dtype=self.dtype, name='b')`
`47`		`- self.A = tf.Variable(tf.random_uniform([self.tag_count, self.tag_count], -0.05, 0.05, dtype=self.dtype),`
`48`		`- dtype=self.dtype, name='A')`
	`49`	`+ dtype=self.dtype), name='w')`
	`50`	`+ self.b = tf.Variable(tf.zeros([self.tag_count, 1], dtype=self.dtype), name='b')`
	`51`	`+ self.A = tf.Variable(tf.random_uniform([self.tag_count, self.tag_count], -0.05, 0.05, dtype=self.dtype), name='A')`
`49`	`52`	`self.Ap = tf.placeholder(self.dtype, shape=self.A.get_shape())`
`50`		`- self.init_A = tf.Variable(tf.random_uniform([self.tag_count], -0.05, 0.05, dtype=self.dtype), dtype=self.dtype,`
`51`		`- name='init_A')`
	`53`	`+ self.init_A = tf.Variable(tf.random_uniform([self.tag_count], -0.05, 0.05, dtype=self.dtype), name='init_A')`
`52`	`54`	`self.init_Ap = tf.placeholder(self.dtype, shape=self.init_A.get_shape())`
`53`		`- self.update_A_op = self.A.assign((1 - self.lam) * (tf.add(self.A, self.alpha * self.Ap)))`
`54`		`- self.update_init_A_op = self.init_A.assign((1 - self.lam) * (tf.add(self.init_A, self.alpha * self.init_Ap)))`
	`55`	`+ self.update_A_op = self.A.assign(tf.add((1 - self.alpha * self.lam) * self.A, self.alpha * self.Ap))`
	`56`	`+ self.update_init_A_op = self.init_A.assign(`
	`57`	`+ tf.add((1 - self.alpha * self.lam) * self.init_A, self.alpha * self.init_Ap))`
`55`	`58`	`self.sentence_holder = tf.placeholder(tf.int32, shape=[None, self.window_size])`
`56`		`- self.lookup_op = tf.nn.embedding_lookup(self.embeddings, self.sentence_holder).reshape([-1,self.concat_embed_size])`
	`59`	`+ self.lookup_op = tf.reshape(tf.nn.embedding_lookup(self.embeddings, self.sentence_holder),`
	`60`	`+ [-1, 1, self.concat_embed_size])`
`57`	`61`	`self.indices = tf.placeholder(tf.int32, shape=[None, 2])`
`58`	`62`	`self.shape = tf.placeholder(tf.int32, shape=[2])`
`59`	`63`	`self.values = tf.placeholder(self.dtype, shape=[None])`
`60`	`64`	`self.map_matrix_op = tf.sparse_to_dense(self.indices, self.shape, self.values, validate_indices=False)`
`61`	`65`	`self.map_matrix = tf.placeholder(self.dtype, shape=[self.tag_count, None])`
`62`	`66`	`self.lstm = tf.contrib.rnn.LSTMCell(self.hidden_units)`
`63`		`- self.lstm_output, self.lstm_out_state = tf.nn.dynamic_rnn(self.lstm, self.x, dtype=self.dtype)`
`64`		`- #self.lstm_output, self.lstm_out_state = tf.nn.dynamic_rnn(self.lstm, self.x, dtype=self.dtype)`
	`67`	`+ # self.lstm_output, self.lstm_out_state = tf.nn.dynamic_rnn(self.lstm, self.x, dtype=self.dtype)`
	`68`	`+ self.lstm_output, self.lstm_out_state = tf.nn.dynamic_rnn(self.lstm, self.lookup_op, dtype=self.dtype,`
	`69`	`+ time_major=True)`
`65`	`70`	`tf.global_variables_initializer().run(session=self.sess)`
`66`		`- self.word_scores = tf.matmul(self.w, tf.transpose(self.lstm_output[0])) + self.b`
`67`		`- self.loss_scores = tf.reduce_sum(tf.multiply(self.map_matrix, self.word_scores),0)`
`68`		`- self.loss = tf.reduce_sum(self.loss_scores)`
	`71`	`+ self.word_scores = tf.matmul(self.w, tf.transpose(self.lstm_output[:, -1, :])) + self.b`
	`72`	`+ self.loss_scores = tf.reduce_sum(tf.multiply(self.map_matrix, self.word_scores), 0)`
`69`	`73`	`self.lstm_variable = [v for v in tf.global_variables() if v.name.startswith('rnn')]`
`70`	`74`	`self.params = [self.w, self.b] + self.lstm_variable`
	`75`	`+ self.loss = tf.reduce_sum(self.loss_scores) + tf.contrib.layers.apply_regularization(`
	`76`	`+ tf.contrib.layers.l2_regularizer(self.lam), self.params + [self.embeddings])`
`71`	`77`	`self.regularization = list(map(lambda p: tf.assign_sub(p, self.lam * p), self.params))`
`72`		`- self.train = self.optimizer.minimize(self.loss, var_list=self.params)`
	`78`	`+ self.train = self.optimizer.minimize(self.loss, var_list=self.params + [self.embeddings])`
	`79`	`+ # tf.global_variables_initializer().run(session=self.sess)`
`73`	`80`	`self.embedp = tf.placeholder(self.dtype, shape=[None, self.embed_size])`
`74`	`81`	`self.embed_index = tf.placeholder(tf.int32, shape=[None])`
`75`	`82`	`self.update_embed_op = tf.scatter_update(self.embeddings, self.embed_index, self.embedp)`
`76`	`83`	`self.sentence_index = 0`
`77`	`84`	`self.grad_embed = tf.gradients(self.loss_scores[self.sentence_index], self.x)`
`78`	`85`	`self.saver = tf.train.Saver(self.params + [self.embeddings, self.A, self.init_A], max_to_keep=100)`
`79`	`86`
`80`		`- def model(self, embeds):`
`81`		`- scores = self.sess.run(self.word_scores, feed_dict={self.x: np.expand_dims(embeds, 0)})`
	`87`	`+ def model(self, sentence):`
	`88`	`+ scores = self.sess.run(self.word_scores, feed_dict={self.sentence_holder: sentence})`
`82`	`89`	`path = self.viterbi(scores, self.A.eval(self.sess), self.init_A.eval(self.sess))`
`83`	`90`	`return path`
`84`	`91`
`@@ -88,18 +95,19 @@ def train_exe(self):`
`88`	`95`	`for i in range(10):`
`89`	`96`	`for sentence_index, (sentence, tags) in enumerate(zip(self.words_batch, self.tags_batch)):`
`90`	`97`	`self.train_sentence(sentence, tags, len(tags))`
`91`		`- if sentence_index >0 and sentence_index % 500 == 0:`
	`98`	`+ if sentence_index >0 and sentence_index % 1000 == 0:`
`92`	`99`	`print(sentence_index)`
`93`	`100`	`print(time.time() - last_time)`
`94`	`101`	`last_time = time.time()`
`95`		`- print(self.cal_loss(sentence_index-500,sentence_index))`
	`102`	`+ # print(self.cal_loss(sentence_index-500,sentence_index))`
`96`	`103`	`print(self.sess.run(self.init_A))`
`97`	`104`	`self.saver.save(self.sess, 'tmp/lstm-model%d.ckpt' % i)`
`98`	`105`
`99`	`106`	`def train_sentence(self, sentence, tags, length):`
`100`		`- sentence_embeds = self.sess.run(self.lookup_op, feed_dict={self.sentence_holder: sentence}).reshape(`
`101`		`- [length, self.concat_embed_size])`
`102`		`- current_tags = self.model(sentence_embeds)`
	`107`	`+ # sentence_embeds = self.sess.run(self.lookup_op, feed_dict={self.sentence_holder: sentence}).reshape(`
	`108`	`+ # [length, self.concat_embed_size])`
	`109`	`+ # print(sentence_embeds.shape)`
	`110`	`+ current_tags = self.model(sentence)`
`103`	`111`	`diff_tags = np.subtract(tags, current_tags)`
`104`	`112`	`update_index = np.where(diff_tags != 0)[0]`
`105`	`113`	`update_length = len(update_index)`
`@@ -119,9 +127,10 @@ def train_sentence(self, sentence, tags, length):`
`119`	`127`	`self.values: sparse_values})`
`120`	`128`
`121`	`129`	`# 更新参数`
`122`		`- self.sess.run(self.train,`
`123`		`- feed_dict={self.x: np.expand_dims(sentence_embeds, 0), self.map_matrix: sentence_matrix})`
`124`		`- self.sess.run(self.regularization)`
	`130`	`+ # self.sess.run(self.train,`
	`131`	`+ # feed_dict={self.x: np.expand_dims(sentence_embeds, 0), self.map_matrix: sentence_matrix})`
	`132`	`+ self.sess.run(self.train, feed_dict={self.sentence_holder: sentence, self.map_matrix: sentence_matrix})`
	`133`	`+ # self.sess.run(self.regularization)`
`125`	`134`
`126`	`135`	`'''`
`127`	`136`	`# 更新词向量`
`@@ -144,10 +153,9 @@ def train_sentence(self, sentence, tags, length):`
`144`	`153`	`self.sess.run(self.update_init_A_op, feed_dict={self.init_Ap: init_A_update})`
`145`	`154`	`self.sess.run(self.update_A_op, {self.Ap: A_update})`
`146`	`155`
`147`		`- @staticmethod`
`148`		`- def gen_update_A(correct_tags, current_tags):`
`149`		`- A_update = np.zeros([4, 4], dtype=np.float32)`
`150`		`- init_A_update = np.zeros([4], dtype=np.float32)`
	`156`	`+ def gen_update_A(self, correct_tags, current_tags):`
	`157`	`+ A_update = np.zeros([self.tag_count, self.tag_count], dtype=np.float32)`
	`158`	`+ init_A_update = np.zeros([self.tag_count], dtype=np.float32)`
`151`	`159`	`before_corr = correct_tags[0]`
`152`	`160`	`before_curr = current_tags[0]`
`153`	`161`	`update_init = False`
`@@ -171,21 +179,22 @@ def cal_loss(self, start, end):`
`171`	`179`	`A = self.A.eval(session=self.sess)`
`172`	`180`	`init_A = self.init_A.eval(session=self.sess)`
`173`	`181`	`for sentence_index, (sentence, tags) in enumerate(zip(self.words_batch[start:end], self.tags_batch[start:end])):`
`174`		`- sentence_embeds = self.sess.run(self.lookup_op, feed_dict={self.sentence_holder: sentence}).reshape(`
`175`		`- [len(sentence), self.concat_embed_size])`
`176`		`- sentence_score = self.sess.run(self.word_scores, feed_dict={self.x: np.expand_dims(sentence_embeds, 0)})`
	`182`	`+ sentence_score = self.sess.run(self.word_scores, feed_dict={self.sentence_holder: sentence})`
`177`	`183`	`loss += self.cal_sentence_loss(tags, sentence_score, A, init_A)`
`178`	`184`	`return loss`
`179`	`185`
`180`		`- def seg(self, sentence, model_path='tmp/lstm-model0.ckpt'):`
	`186`	`+ def seg(self, sentence, model_path='tmp/lstm-model0.ckpt', debug=False):`
`181`	`187`	`self.saver.restore(self.sess, model_path)`
`182`	`188`	`seq = self.index2seq(self.sentence2index(sentence))`
`183`	`189`	`sentence_embeds = tf.nn.embedding_lookup(self.embeddings, seq).eval(session=self.sess).reshape(`
`184`	`190`	`[len(sentence), self.concat_embed_size])`
`185`		`- sentence_scores = self.sess.run(self.word_scores, feed_dict={self.x: np.expand_dims(sentence_embeds, 0)})`
	`191`	`+ sentence_scores = self.sess.run(self.word_scores, feed_dict={self.sentence_holder: seq})`
`186`	`192`	`init_A_val = self.init_A.eval(session=self.sess)`
`187`	`193`	`A_val = self.A.eval(session=self.sess)`
`188`		`- print(A_val)`
	`194`	`+ if debug:`
	`195`	`+ print(A_val)`
	`196`	`+ # print(sentence_embeds[1])`
	`197`	`+ print(sentence_scores.T)`
`189`	`198`	`current_tags = self.viterbi(sentence_scores, A_val, init_A_val)`
`190`	`199`	`return self.tags2words(sentence, current_tags), current_tags`
`191`	`200`

0 commit comments

Comments

(0)

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit a783f6b

File tree

1 file changed

1 file changed

`‎seg_lstm.py‎`

0 commit comments