diff --git a/docs/search.js b/docs/search.js
index fef9748..1876d85 100644
--- a/docs/search.js
+++ b/docs/search.js
@@ -1,6 +1,6 @@
 window.pdocSearch = (function(){
 /** elasticlunr - http://weixsong.github.io * Copyright (C) 2017 Oliver Nightingale * Copyright (C) 2017 Wei Song * MIT Licensed */!function(){function e(e){if(null===e||"object"!=typeof e)return e;var t=e.constructor();for(var n in e)e.hasOwnProperty(n)&&(t[n]=e[n]);return t}var t=function(e){var n=new t.Index;return n.pipeline.add(t.trimmer,t.stopWordFilter,t.stemmer),e&&e.call(n,n),n};t.version="0.9.5",lunr=t,t.utils={},t.utils.warn=function(e){return function(t){e.console&&console.warn&&console.warn(t)}}(this),t.utils.toString=function(e){return void 0===e||null===e?"":e.toString()},t.EventEmitter=function(){this.events={}},t.EventEmitter.prototype.addListener=function(){var e=Array.prototype.slice.call(arguments),t=e.pop(),n=e;if("function"!=typeof t)throw new TypeError("last argument must be a function");n.forEach(function(e){this.hasHandler(e)||(this.events[e]=[]),this.events[e].push(t)},this)},t.EventEmitter.prototype.removeListener=function(e,t){if(this.hasHandler(e)){var n=this.events[e].indexOf(t);-1!==n&&(this.events[e].splice(n,1),0==this.events[e].length&&delete this.events[e])}},t.EventEmitter.prototype.emit=function(e){if(this.hasHandler(e)){var t=Array.prototype.slice.call(arguments,1);this.events[e].forEach(function(e){e.apply(void 0,t)},this)}},t.EventEmitter.prototype.hasHandler=function(e){return e in this.events},t.tokenizer=function(e){if(!arguments.length||null===e||void 0===e)return[];if(Array.isArray(e)){var n=e.filter(function(e){return null===e||void 0===e?!1:!0});n=n.map(function(e){return t.utils.toString(e).toLowerCase()});var i=[];return n.forEach(function(e){var n=e.split(t.tokenizer.seperator);i=i.concat(n)},this),i}return e.toString().trim().toLowerCase().split(t.tokenizer.seperator)},t.tokenizer.defaultSeperator=/[\s\-]+/,t.tokenizer.seperator=t.tokenizer.defaultSeperator,t.tokenizer.setSeperator=function(e){null!==e&&void 0!==e&&"object"==typeof e&&(t.tokenizer.seperator=e)},t.tokenizer.resetSeperator=function(){t.tokenizer.seperator=t.tokenizer.defaultSeperator},t.tokenizer.getSeperator=function(){return t.tokenizer.seperator},t.Pipeline=function(){this._queue=[]},t.Pipeline.registeredFunctions={},t.Pipeline.registerFunction=function(e,n){n in t.Pipeline.registeredFunctions&&t.utils.warn("Overwriting existing registered function: "+n),e.label=n,t.Pipeline.registeredFunctions[n]=e},t.Pipeline.getRegisteredFunction=function(e){return e in t.Pipeline.registeredFunctions!=!0?null:t.Pipeline.registeredFunctions[e]},t.Pipeline.warnIfFunctionNotRegistered=function(e){var n=e.label&&e.label in this.registeredFunctions;n||t.utils.warn("Function is not registered with pipeline. This may cause problems when serialising the index.\n",e)},t.Pipeline.load=function(e){var n=new t.Pipeline;return e.forEach(function(e){var i=t.Pipeline.getRegisteredFunction(e);if(!i)throw new Error("Cannot load un-registered function: "+e);n.add(i)}),n},t.Pipeline.prototype.add=function(){var e=Array.prototype.slice.call(arguments);e.forEach(function(e){t.Pipeline.warnIfFunctionNotRegistered(e),this._queue.push(e)},this)},t.Pipeline.prototype.after=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i+1,0,n)},t.Pipeline.prototype.before=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i,0,n)},t.Pipeline.prototype.remove=function(e){var t=this._queue.indexOf(e);-1!==t&&this._queue.splice(t,1)},t.Pipeline.prototype.run=function(e){for(var t=[],n=e.length,i=this._queue.length,o=0;n>o;o++){for(var r=e[o],s=0;i>s&&(r=this._queue[s](r,o,e),void 0!==r&&null!==r);s++);void 0!==r&&null!==r&&t.push(r)}return t},t.Pipeline.prototype.reset=function(){this._queue=[]},t.Pipeline.prototype.get=function(){return this._queue},t.Pipeline.prototype.toJSON=function(){return this._queue.map(function(e){return t.Pipeline.warnIfFunctionNotRegistered(e),e.label})},t.Index=function(){this._fields=[],this._ref="id",this.pipeline=new t.Pipeline,this.documentStore=new t.DocumentStore,this.index={},this.eventEmitter=new t.EventEmitter,this._idfCache={},this.on("add","remove","update",function(){this._idfCache={}}.bind(this))},t.Index.prototype.on=function(){var e=Array.prototype.slice.call(arguments);return this.eventEmitter.addListener.apply(this.eventEmitter,e)},t.Index.prototype.off=function(e,t){return this.eventEmitter.removeListener(e,t)},t.Index.load=function(e){e.version!==t.version&&t.utils.warn("version mismatch: current "+t.version+" importing "+e.version);var n=new this;n._fields=e.fields,n._ref=e.ref,n.documentStore=t.DocumentStore.load(e.documentStore),n.pipeline=t.Pipeline.load(e.pipeline),n.index={};for(var i in e.index)n.index[i]=t.InvertedIndex.load(e.index[i]);return n},t.Index.prototype.addField=function(e){return this._fields.push(e),this.index[e]=new t.InvertedIndex,this},t.Index.prototype.setRef=function(e){return this._ref=e,this},t.Index.prototype.saveDocument=function(e){return this.documentStore=new t.DocumentStore(e),this},t.Index.prototype.addDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.addDoc(i,e),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));this.documentStore.addFieldLength(i,n,o.length);var r={};o.forEach(function(e){e in r?r[e]+=1:r[e]=1},this);for(var s in r){var u=r[s];u=Math.sqrt(u),this.index[n].addToken(s,{ref:i,tf:u})}},this),n&&this.eventEmitter.emit("add",e,this)}},t.Index.prototype.removeDocByRef=function(e){if(e&&this.documentStore.isDocStored()!==!1&&this.documentStore.hasDoc(e)){var t=this.documentStore.getDoc(e);this.removeDoc(t,!1)}},t.Index.prototype.removeDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.hasDoc(i)&&(this.documentStore.removeDoc(i),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));o.forEach(function(e){this.index[n].removeToken(e,i)},this)},this),n&&this.eventEmitter.emit("remove",e,this))}},t.Index.prototype.updateDoc=function(e,t){var t=void 0===t?!0:t;this.removeDocByRef(e[this._ref],!1),this.addDoc(e,!1),t&&this.eventEmitter.emit("update",e,this)},t.Index.prototype.idf=function(e,t){var n="@"+t+"/"+e;if(Object.prototype.hasOwnProperty.call(this._idfCache,n))return this._idfCache[n];var i=this.index[t].getDocFreq(e),o=1+Math.log(this.documentStore.length/(i+1));return this._idfCache[n]=o,o},t.Index.prototype.getFields=function(){return this._fields.slice()},t.Index.prototype.search=function(e,n){if(!e)return[];e="string"==typeof e?{any:e}:JSON.parse(JSON.stringify(e));var i=null;null!=n&&(i=JSON.stringify(n));for(var o=new t.Configuration(i,this.getFields()).get(),r={},s=Object.keys(e),u=0;u<s.length;u++){var a=s[u];r[a]=this.pipeline.run(t.tokenizer(e[a]))}var l={};for(var c in o){var d=r[c]||r.any;if(d){var f=this.fieldSearch(d,c,o),h=o[c].boost;for(var p in f)f[p]=f[p]*h;for(var p in f)p in l?l[p]+=f[p]:l[p]=f[p]}}var v,g=[];for(var p in l)v={ref:p,score:l[p]},this.documentStore.hasDoc(p)&&(v.doc=this.documentStore.getDoc(p)),g.push(v);return g.sort(function(e,t){return t.score-e.score}),g},t.Index.prototype.fieldSearch=function(e,t,n){var i=n[t].bool,o=n[t].expand,r=n[t].boost,s=null,u={};return 0!==r?(e.forEach(function(e){var n=[e];1==o&&(n=this.index[t].expandToken(e));var r={};n.forEach(function(n){var o=this.index[t].getDocs(n),a=this.idf(n,t);if(s&&"AND"==i){var l={};for(var c in s)c in o&&(l[c]=o[c]);o=l}n==e&&this.fieldSearchStats(u,n,o);for(var c in o){var d=this.index[t].getTermFrequency(n,c),f=this.documentStore.getFieldLength(c,t),h=1;0!=f&&(h=1/Math.sqrt(f));var p=1;n!=e&&(p=.15*(1-(n.length-e.length)/n.length));var v=d*a*h*p;c in r?r[c]+=v:r[c]=v}},this),s=this.mergeScores(s,r,i)},this),s=this.coordNorm(s,u,e.length)):void 0},t.Index.prototype.mergeScores=function(e,t,n){if(!e)return t;if("AND"==n){var i={};for(var o in t)o in e&&(i[o]=e[o]+t[o]);return i}for(var o in t)o in e?e[o]+=t[o]:e[o]=t[o];return e},t.Index.prototype.fieldSearchStats=function(e,t,n){for(var i in n)i in e?e[i].push(t):e[i]=[t]},t.Index.prototype.coordNorm=function(e,t,n){for(var i in e)if(i in t){var o=t[i].length;e[i]=e[i]*o/n}return e},t.Index.prototype.toJSON=function(){var e={};return this._fields.forEach(function(t){e[t]=this.index[t].toJSON()},this),{version:t.version,fields:this._fields,ref:this._ref,documentStore:this.documentStore.toJSON(),index:e,pipeline:this.pipeline.toJSON()}},t.Index.prototype.use=function(e){var t=Array.prototype.slice.call(arguments,1);t.unshift(this),e.apply(this,t)},t.DocumentStore=function(e){this._save=null===e||void 0===e?!0:e,this.docs={},this.docInfo={},this.length=0},t.DocumentStore.load=function(e){var t=new this;return t.length=e.length,t.docs=e.docs,t.docInfo=e.docInfo,t._save=e.save,t},t.DocumentStore.prototype.isDocStored=function(){return this._save},t.DocumentStore.prototype.addDoc=function(t,n){this.hasDoc(t)||this.length++,this.docs[t]=this._save===!0?e(n):null},t.DocumentStore.prototype.getDoc=function(e){return this.hasDoc(e)===!1?null:this.docs[e]},t.DocumentStore.prototype.hasDoc=function(e){return e in this.docs},t.DocumentStore.prototype.removeDoc=function(e){this.hasDoc(e)&&(delete this.docs[e],delete this.docInfo[e],this.length--)},t.DocumentStore.prototype.addFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&(this.docInfo[e]||(this.docInfo[e]={}),this.docInfo[e][t]=n)},t.DocumentStore.prototype.updateFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&this.addFieldLength(e,t,n)},t.DocumentStore.prototype.getFieldLength=function(e,t){return null===e||void 0===e?0:e in this.docs&&t in this.docInfo[e]?this.docInfo[e][t]:0},t.DocumentStore.prototype.toJSON=function(){return{docs:this.docs,docInfo:this.docInfo,length:this.length,save:this._save}},t.stemmer=function(){var e={ational:"ate",tional:"tion",enci:"ence",anci:"ance",izer:"ize",bli:"ble",alli:"al",entli:"ent",eli:"e",ousli:"ous",ization:"ize",ation:"ate",ator:"ate",alism:"al",iveness:"ive",fulness:"ful",ousness:"ous",aliti:"al",iviti:"ive",biliti:"ble",logi:"log"},t={icate:"ic",ative:"",alize:"al",iciti:"ic",ical:"ic",ful:"",ness:""},n="[^aeiou]",i="[aeiouy]",o=n+"[^aeiouy]*",r=i+"[aeiou]*",s="^("+o+")?"+r+o,u="^("+o+")?"+r+o+"("+r+")?$",a="^("+o+")?"+r+o+r+o,l="^("+o+")?"+i,c=new RegExp(s),d=new RegExp(a),f=new RegExp(u),h=new RegExp(l),p=/^(.+?)(ss|i)es$/,v=/^(.+?)([^s])s$/,g=/^(.+?)eed$/,m=/^(.+?)(ed|ing)$/,y=/.$/,S=/(at|bl|iz)$/,x=new RegExp("([^aeiouylsz])\\1$"),w=new RegExp("^"+o+i+"[^aeiouwxy]$"),I=/^(.+?[^aeiou])y$/,b=/^(.+?)(ational|tional|enci|anci|izer|bli|alli|entli|eli|ousli|ization|ation|ator|alism|iveness|fulness|ousness|aliti|iviti|biliti|logi)$/,E=/^(.+?)(icate|ative|alize|iciti|ical|ful|ness)$/,D=/^(.+?)(al|ance|ence|er|ic|able|ible|ant|ement|ment|ent|ou|ism|ate|iti|ous|ive|ize)$/,F=/^(.+?)(s|t)(ion)$/,_=/^(.+?)e$/,P=/ll$/,k=new RegExp("^"+o+i+"[^aeiouwxy]$"),z=function(n){var i,o,r,s,u,a,l;if(n.length<3)return n;if(r=n.substr(0,1),"y"==r&&(n=r.toUpperCase()+n.substr(1)),s=p,u=v,s.test(n)?n=n.replace(s,"$1$2"):u.test(n)&&(n=n.replace(u,"$1$2")),s=g,u=m,s.test(n)){var z=s.exec(n);s=c,s.test(z[1])&&(s=y,n=n.replace(s,""))}else if(u.test(n)){var z=u.exec(n);i=z[1],u=h,u.test(i)&&(n=i,u=S,a=x,l=w,u.test(n)?n+="e":a.test(n)?(s=y,n=n.replace(s,"")):l.test(n)&&(n+="e"))}if(s=I,s.test(n)){var z=s.exec(n);i=z[1],n=i+"i"}if(s=b,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+e[o])}if(s=E,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+t[o])}if(s=D,u=F,s.test(n)){var z=s.exec(n);i=z[1],s=d,s.test(i)&&(n=i)}else if(u.test(n)){var z=u.exec(n);i=z[1]+z[2],u=d,u.test(i)&&(n=i)}if(s=_,s.test(n)){var z=s.exec(n);i=z[1],s=d,u=f,a=k,(s.test(i)||u.test(i)&&!a.test(i))&&(n=i)}return s=P,u=d,s.test(n)&&u.test(n)&&(s=y,n=n.replace(s,"")),"y"==r&&(n=r.toLowerCase()+n.substr(1)),n};return z}(),t.Pipeline.registerFunction(t.stemmer,"stemmer"),t.stopWordFilter=function(e){return e&&t.stopWordFilter.stopWords[e]!==!0?e:void 0},t.clearStopWords=function(){t.stopWordFilter.stopWords={}},t.addStopWords=function(e){null!=e&&Array.isArray(e)!==!1&&e.forEach(function(e){t.stopWordFilter.stopWords[e]=!0},this)},t.resetStopWords=function(){t.stopWordFilter.stopWords=t.defaultStopWords},t.defaultStopWords={"":!0,a:!0,able:!0,about:!0,across:!0,after:!0,all:!0,almost:!0,also:!0,am:!0,among:!0,an:!0,and:!0,any:!0,are:!0,as:!0,at:!0,be:!0,because:!0,been:!0,but:!0,by:!0,can:!0,cannot:!0,could:!0,dear:!0,did:!0,"do":!0,does:!0,either:!0,"else":!0,ever:!0,every:!0,"for":!0,from:!0,get:!0,got:!0,had:!0,has:!0,have:!0,he:!0,her:!0,hers:!0,him:!0,his:!0,how:!0,however:!0,i:!0,"if":!0,"in":!0,into:!0,is:!0,it:!0,its:!0,just:!0,least:!0,let:!0,like:!0,likely:!0,may:!0,me:!0,might:!0,most:!0,must:!0,my:!0,neither:!0,no:!0,nor:!0,not:!0,of:!0,off:!0,often:!0,on:!0,only:!0,or:!0,other:!0,our:!0,own:!0,rather:!0,said:!0,say:!0,says:!0,she:!0,should:!0,since:!0,so:!0,some:!0,than:!0,that:!0,the:!0,their:!0,them:!0,then:!0,there:!0,these:!0,they:!0,"this":!0,tis:!0,to:!0,too:!0,twas:!0,us:!0,wants:!0,was:!0,we:!0,were:!0,what:!0,when:!0,where:!0,which:!0,"while":!0,who:!0,whom:!0,why:!0,will:!0,"with":!0,would:!0,yet:!0,you:!0,your:!0},t.stopWordFilter.stopWords=t.defaultStopWords,t.Pipeline.registerFunction(t.stopWordFilter,"stopWordFilter"),t.trimmer=function(e){if(null===e||void 0===e)throw new Error("token should not be undefined");return e.replace(/^\W+/,"").replace(/\W+$/,"")},t.Pipeline.registerFunction(t.trimmer,"trimmer"),t.InvertedIndex=function(){this.root={docs:{},df:0}},t.InvertedIndex.load=function(e){var t=new this;return t.root=e.root,t},t.InvertedIndex.prototype.addToken=function(e,t,n){for(var n=n||this.root,i=0;i<=e.length-1;){var o=e[i];o in n||(n[o]={docs:{},df:0}),i+=1,n=n[o]}var r=t.ref;n.docs[r]?n.docs[r]={tf:t.tf}:(n.docs[r]={tf:t.tf},n.df+=1)},t.InvertedIndex.prototype.hasToken=function(e){if(!e)return!1;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return!1;t=t[e[n]]}return!0},t.InvertedIndex.prototype.getNode=function(e){if(!e)return null;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return null;t=t[e[n]]}return t},t.InvertedIndex.prototype.getDocs=function(e){var t=this.getNode(e);return null==t?{}:t.docs},t.InvertedIndex.prototype.getTermFrequency=function(e,t){var n=this.getNode(e);return null==n?0:t in n.docs?n.docs[t].tf:0},t.InvertedIndex.prototype.getDocFreq=function(e){var t=this.getNode(e);return null==t?0:t.df},t.InvertedIndex.prototype.removeToken=function(e,t){if(e){var n=this.getNode(e);null!=n&&t in n.docs&&(delete n.docs[t],n.df-=1)}},t.InvertedIndex.prototype.expandToken=function(e,t,n){if(null==e||""==e)return[];var t=t||[];if(void 0==n&&(n=this.getNode(e),null==n))return t;n.df>0&&t.push(e);for(var i in n)"docs"!==i&&"df"!==i&&this.expandToken(e+i,t,n[i]);return t},t.InvertedIndex.prototype.toJSON=function(){return{root:this.root}},t.Configuration=function(e,n){var e=e||"";if(void 0==n||null==n)throw new Error("fields should not be null");this.config={};var i;try{i=JSON.parse(e),this.buildUserConfig(i,n)}catch(o){t.utils.warn("user configuration parse failed, will use default configuration"),this.buildDefaultConfig(n)}},t.Configuration.prototype.buildDefaultConfig=function(e){this.reset(),e.forEach(function(e){this.config[e]={boost:1,bool:"OR",expand:!1}},this)},t.Configuration.prototype.buildUserConfig=function(e,n){var i="OR",o=!1;if(this.reset(),"bool"in e&&(i=e.bool||i),"expand"in e&&(o=e.expand||o),"fields"in e)for(var r in e.fields)if(n.indexOf(r)>-1){var s=e.fields[r],u=o;void 0!=s.expand&&(u=s.expand),this.config[r]={boost:s.boost||0===s.boost?s.boost:1,bool:s.bool||i,expand:u}}else t.utils.warn("field name in user configuration not found in index instance fields");else this.addAllFields2UserConfig(i,o,n)},t.Configuration.prototype.addAllFields2UserConfig=function(e,t,n){n.forEach(function(n){this.config[n]={boost:1,bool:e,expand:t}},this)},t.Configuration.prototype.get=function(){return this.config},t.Configuration.prototype.reset=function(){this.config={}},lunr.SortedSet=function(){this.length=0,this.elements=[]},lunr.SortedSet.load=function(e){var t=new this;return t.elements=e,t.length=e.length,t},lunr.SortedSet.prototype.add=function(){var e,t;for(e=0;e<arguments.length;e++)t=arguments[e],~this.indexOf(t)||this.elements.splice(this.locationFor(t),0,t);this.length=this.elements.length},lunr.SortedSet.prototype.toArray=function(){return this.elements.slice()},lunr.SortedSet.prototype.map=function(e,t){return this.elements.map(e,t)},lunr.SortedSet.prototype.forEach=function(e,t){return this.elements.forEach(e,t)},lunr.SortedSet.prototype.indexOf=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;){if(r===e)return o;e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o]}return r===e?o:-1},lunr.SortedSet.prototype.locationFor=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;)e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o];return r>e?o:e>r?o+1:void 0},lunr.SortedSet.prototype.intersect=function(e){for(var t=new lunr.SortedSet,n=0,i=0,o=this.length,r=e.length,s=this.elements,u=e.elements;;){if(n>o-1||i>r-1)break;s[n]!==u[i]?s[n]<u[i]?n++:s[n]>u[i]&&i++:(t.add(s[n]),n++,i++)}return t},lunr.SortedSet.prototype.clone=function(){var e=new lunr.SortedSet;return e.elements=this.toArray(),e.length=e.elements.length,e},lunr.SortedSet.prototype.union=function(e){var t,n,i;this.length>=e.length?(t=this,n=e):(t=e,n=this),i=t.clone();for(var o=0,r=n.toArray();o<r.length;o++)i.add(r[o]);return i},lunr.SortedSet.prototype.toJSON=function(){return this.toArray()},function(e,t){"function"==typeof define&&define.amd?define(t):"object"==typeof exports?module.exports=t():e.elasticlunr=t()}(this,function(){return t})}();
-    /** pdoc search index */const docs = [{"fullname": "uisrnn", "modulename": "uisrnn", "kind": "module", "doc": "<p>The module for Unbounded Interleaved-State Recurrent Neural Network.</p>\n\n<p>An introduction is available at [README.md].</p>\n"}, {"fullname": "uisrnn.parse_arguments", "modulename": "uisrnn", "qualname": "parse_arguments", "kind": "function", "doc": "<p>Parse arguments.</p>\n\n<p>Returns:\n  A tuple of:</p>\n\n<pre><code>- `model_args`: model arguments\n- `training_args`: training arguments\n- `inference_args`: inference arguments\n</code></pre>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.compute_sequence_match_accuracy", "modulename": "uisrnn", "qualname": "compute_sequence_match_accuracy", "kind": "function", "doc": "<p>Compute the accuracy between two sequences by finding optimal matching.</p>\n\n<p>Args:\n  sequence1: A list of integers or strings.\n  sequence2: A list of integers or strings.</p>\n\n<p>Returns:\n  accuracy: sequence matching accuracy as a number in [0.0, 1.0]</p>\n\n<p>Raises:\n  TypeError: If sequence1 or sequence2 is not list.\n  ValueError: If sequence1 and sequence2 are not same size.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sequence1</span>, </span><span class=\"param\"><span class=\"n\">sequence2</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.output_result", "modulename": "uisrnn", "qualname": "output_result", "kind": "function", "doc": "<p>Produce a string to summarize the experiment.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model_args</span>, </span><span class=\"param\"><span class=\"n\">training_args</span>, </span><span class=\"param\"><span class=\"n\">test_record</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN", "modulename": "uisrnn", "qualname": "UISRNN", "kind": "class", "doc": "<p>Unbounded Interleaved-State Recurrent Neural Networks.</p>\n"}, {"fullname": "uisrnn.UISRNN.__init__", "modulename": "uisrnn", "qualname": "UISRNN.__init__", "kind": "function", "doc": "<p>Construct the UISRNN object.</p>\n\n<p>Args:\n  args: Model configurations. See <code>arguments.py</code> for details.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span>)</span>"}, {"fullname": "uisrnn.UISRNN.observation_dim", "modulename": "uisrnn", "qualname": "UISRNN.observation_dim", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.device", "modulename": "uisrnn", "qualname": "UISRNN.device", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.rnn_model", "modulename": "uisrnn", "qualname": "UISRNN.rnn_model", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.rnn_init_hidden", "modulename": "uisrnn", "qualname": "UISRNN.rnn_init_hidden", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.estimate_sigma2", "modulename": "uisrnn", "qualname": "UISRNN.estimate_sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.estimate_transition_bias", "modulename": "uisrnn", "qualname": "UISRNN.estimate_transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.sigma2", "modulename": "uisrnn", "qualname": "UISRNN.sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.transition_bias", "modulename": "uisrnn", "qualname": "UISRNN.transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.transition_bias_denominator", "modulename": "uisrnn", "qualname": "UISRNN.transition_bias_denominator", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.crp_alpha", "modulename": "uisrnn", "qualname": "UISRNN.crp_alpha", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.logger", "modulename": "uisrnn", "qualname": "UISRNN.logger", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.save", "modulename": "uisrnn", "qualname": "UISRNN.save", "kind": "function", "doc": "<p>Save the model to a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.load", "modulename": "uisrnn", "qualname": "UISRNN.load", "kind": "function", "doc": "<p>Load the model from a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.fit_concatenated", "modulename": "uisrnn", "qualname": "UISRNN.fit_concatenated", "kind": "function", "doc": "<p>Fit UISRNN model to concatenated sequence and cluster_id.</p>\n\n<p>Args:\n  train_sequence: the training observation sequence, which is a\n    2-dim numpy array of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: summation of lengths of all utterances.\n- `D`: observation dimension.\n\nFor example,\n</code></pre>\n\n<p><pre><code>train_sequence =\n[[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance 'iaaa'\n [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance 'ibbb'\n [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'</p>\n\n</code></pre>\n    Here `N=5`, `D=4`.\n<pre><code>We concatenate all training utterances into this single sequence.\n\n<p></code></pre>\n  train_cluster_id: the speaker id sequence, which is 1-dim list or\n    numpy array of strings, of size <code>N</code>.\n    For example,\n  <pre><code>train_cluster_id =\n  ['iaaa_0', 'iaaa_1', 'iaaa_0', 'ibbb_0', 'ibbb_0']\n</code></pre>\n    'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.</p>\n\n<pre><code>Note that the order of entries within an utterance are preserved,\nand all utterances are simply concatenated together.\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequence or train_cluster_id is of wrong type.\n  ValueError: If train_sequence or train_cluster_id has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequence</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_id</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.fit", "modulename": "uisrnn", "qualname": "UISRNN.fit", "kind": "function", "doc": "<p>Fit UISRNN model.</p>\n\n<p>Args:\n  train_sequences: Either a list of training sequences, or a single\n    concatenated training sequence:</p>\n\n<pre><code>1. train_sequences is list, and each element is a 2-dim numpy array\n   of real numbers, of size: `length * D`.\n   The length varies among different sequences, but the D is the same.\n   In speaker diarization, each sequence is the sequence of speaker\n   embeddings of one utterance.\n2. train_sequences is a single concatenated sequence, which is a\n   2-dim numpy array of real numbers. See `fit_concatenated()`\n   for more details.\n</code></pre>\n\n<p>train_cluster_ids: Ground truth labels for train_sequences:</p>\n\n<pre><code>1. if train_sequences is a list, this must also be a list of the same\n   size, each element being a 1-dim list or numpy array of strings.\n2. if train_sequences is a single concatenated sequence, this\n   must also be the concatenated 1-dim list or numpy array of strings\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequences or train_cluster_ids is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequences</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_ids</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.predict_single", "modulename": "uisrnn", "qualname": "UISRNN.predict_single", "kind": "function", "doc": "<p>Predict labels for a single test sequence using UISRNN model.</p>\n\n<p>Args:\n  test_sequence: the test observation sequence, which is 2-dim numpy array\n    of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: length of one test utterance.\n- `D` : observation dimension.\n\nFor example:\n</code></pre>\n\n<p><pre><code>test_sequence =\n[[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance 'iccc'\n [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance 'iccc'\n [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance 'iccc'\n [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance 'iccc'\n [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance 'iccc'\n</code></pre>\n    Here <code>N=5</code>, <code>D=4</code>.\n  args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_id: predicted speaker id sequence, which is\n    an array of integers, of size <code>N</code>.\n    For example, <code>predicted_cluster_id = [0, 1, 0, 0, 1]</code></p>\n\n<p>Raises:\n  TypeError: If test_sequence is of wrong type.\n  ValueError: If test_sequence has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequence</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.predict", "modulename": "uisrnn", "qualname": "UISRNN.predict", "kind": "function", "doc": "<p>Predict labels for a single or many test sequences using UISRNN model.</p>\n\n<p>Args:\n  test_sequences: Either a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_ids: Predicted labels for test_sequences.</p>\n\n<pre><code>1. if test_sequences is a list, predicted_cluster_ids will be a list\n   of the same size, where each element being a 1-dim list of strings.\n2. if test_sequences is a single sequence, predicted_cluster_ids will\n   be a 1-dim list of strings\n</code></pre>\n\n<p>Raises:\n  TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.parallel_predict", "modulename": "uisrnn", "qualname": "parallel_predict", "kind": "function", "doc": "<p>Run prediction in parallel using torch.multiprocessing.</p>\n\n<p>This is a beta feature. It makes prediction slower on CPU. But it's reported\nthat it makes prediction faster on GPU.</p>\n\n<p>Args:\n  model: instance of UISRNN model\n  test_sequences: a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.\n  num_processes: number of parallel processes.</p>\n\n<p>Returns:\n  a list of the same size as test_sequences, where each element\n  being a 1-dim list of strings.</p>\n\n<p>Raises:\n    TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">num_processes</span><span class=\"o\">=</span><span class=\"mi\">4</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.arguments", "modulename": "uisrnn.arguments", "kind": "module", "doc": "<p>Arguments for UISRNN.</p>\n"}, {"fullname": "uisrnn.arguments.str2bool", "modulename": "uisrnn.arguments", "qualname": "str2bool", "kind": "function", "doc": "<p>A function to convert string to bool value.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">value</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.arguments.parse_arguments", "modulename": "uisrnn.arguments", "qualname": "parse_arguments", "kind": "function", "doc": "<p>Parse arguments.</p>\n\n<p>Returns:\n  A tuple of:</p>\n\n<pre><code>- `model_args`: model arguments\n- `training_args`: training arguments\n- `inference_args`: inference arguments\n</code></pre>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.contrib", "modulename": "uisrnn.contrib", "kind": "module", "doc": "<p>The module for community contributed code.</p>\n\n<p>An introduction is available at [README.md].</p>\n"}, {"fullname": "uisrnn.contrib.contrib_template", "modulename": "uisrnn.contrib.contrib_template", "kind": "module", "doc": "<p>This is a template for community contributions.</p>\n"}, {"fullname": "uisrnn.contrib.contrib_template.example_function", "modulename": "uisrnn.contrib.contrib_template", "qualname": "example_function", "kind": "function", "doc": "<p>This is an example function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.contrib.range_search_crp_alpha", "modulename": "uisrnn.contrib.range_search_crp_alpha", "kind": "module", "doc": "<p>This module implements method to search for best crp_alpha within a range for\na given data set.\n For example\n <pre><code>  train_cluster_id = np.array(\n    ['0_0', '0_0', '0_1', '0_1', '0_1', '0_0', '0_0', '1_0', '1_0', '1_0',\n    '1_1', '1_1', '1_1', '1_0', '1_0','1_0', '1_2', '1_2', '1_2'])\n  print(estimate_crp_alpha(train_cluster_id))\n  0.5\n</code></pre>\n Function for user:\n   estimate_crp_alpha: see docstring for details.\n Internal functions:\n   _get_cdf: see docstring for details.\n   _get_cdf_single: see docstring for details.\n   _get_k_t: see docstring for details.\n   _get_n_kt: see docstring for details.\n   _get_cluster_id_single: see docstring for details.\n   _get_normalized_id: see docstring for details.</p>\n"}, {"fullname": "uisrnn.contrib.range_search_crp_alpha.estimate_crp_alpha", "modulename": "uisrnn.contrib.range_search_crp_alpha", "qualname": "estimate_crp_alpha", "kind": "function", "doc": "<p>Iterate through a range of alpha, return alpha with maximum cdf P{Y|Z}.</p>\n\n<p>Args:\n  train_cluster_id: same as train_cluster_id in demo.py. See <code>demo.py</code> for\n    details.\n  search_range: the range to search for crp_alpha.\n  search_step: the step to search for crp_alpha.\nReturns:\n  cur_alpha: a float variable.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">train_cluster_id</span>, </span><span class=\"param\"><span class=\"n\">search_range</span><span class=\"o\">=</span><span class=\"mi\">1</span>, </span><span class=\"param\"><span class=\"n\">search_step</span><span class=\"o\">=</span><span class=\"mf\">0.01</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.evals", "modulename": "uisrnn.evals", "kind": "module", "doc": "<p>Utils for model evaluation.</p>\n"}, {"fullname": "uisrnn.evals.get_list_inverse_index", "modulename": "uisrnn.evals", "qualname": "get_list_inverse_index", "kind": "function", "doc": "<p>Get value to position index from a list of unique ids.</p>\n\n<p>Args:\n  unique_ids: A list of unique integers of strings.</p>\n\n<p>Returns:\n  result: a dict from value to position</p>\n\n<p>Raises:\n  TypeError: If unique_ids is not a list.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">unique_ids</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.evals.compute_sequence_match_accuracy", "modulename": "uisrnn.evals", "qualname": "compute_sequence_match_accuracy", "kind": "function", "doc": "<p>Compute the accuracy between two sequences by finding optimal matching.</p>\n\n<p>Args:\n  sequence1: A list of integers or strings.\n  sequence2: A list of integers or strings.</p>\n\n<p>Returns:\n  accuracy: sequence matching accuracy as a number in [0.0, 1.0]</p>\n\n<p>Raises:\n  TypeError: If sequence1 or sequence2 is not list.\n  ValueError: If sequence1 and sequence2 are not same size.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sequence1</span>, </span><span class=\"param\"><span class=\"n\">sequence2</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.loss_func", "modulename": "uisrnn.loss_func", "kind": "module", "doc": "<p>Loss functions for training.</p>\n"}, {"fullname": "uisrnn.loss_func.weighted_mse_loss", "modulename": "uisrnn.loss_func", "qualname": "weighted_mse_loss", "kind": "function", "doc": "<p>Compute weighted MSE loss.</p>\n\n<p>Note that we are doing weighted loss that only sum up over non-zero entries.</p>\n\n<p>Args:\n  input_tensor: input tensor\n  target_tensor: target tensor\n  weight: weight tensor, in this case 1/sigma^2</p>\n\n<p>Returns:\n  the weighted MSE loss</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_tensor</span>, </span><span class=\"param\"><span class=\"n\">target_tensor</span>, </span><span class=\"param\"><span class=\"n\">weight</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.loss_func.sigma2_prior_loss", "modulename": "uisrnn.loss_func", "qualname": "sigma2_prior_loss", "kind": "function", "doc": "<p>Compute sigma2 prior loss.</p>\n\n<p>Args:\n  num_non_zero: since rnn_truth is a collection of different length sequences\n      padded with zeros to fit them into a tensor, we count the sum of\n      'real lengths' of all sequences\n  sigma_alpha: inverse gamma shape\n  sigma_beta: inverse gamma scale\n  sigma2: sigma squared</p>\n\n<p>Returns:\n  the sigma2 prior loss</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">num_non_zero</span>, </span><span class=\"param\"><span class=\"n\">sigma_alpha</span>, </span><span class=\"param\"><span class=\"n\">sigma_beta</span>, </span><span class=\"param\"><span class=\"n\">sigma2</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.loss_func.regularization_loss", "modulename": "uisrnn.loss_func", "qualname": "regularization_loss", "kind": "function", "doc": "<p>Compute regularization loss.</p>\n\n<p>Args:\n  params: iterable of all parameters\n  weight: weight for the regularization term</p>\n\n<p>Returns:\n  the regularization loss</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">params</span>, </span><span class=\"param\"><span class=\"n\">weight</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn", "modulename": "uisrnn.uisrnn", "kind": "module", "doc": "<p>The UIS-RNN model.</p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN", "kind": "class", "doc": "<p>The core Recurent Neural Network used by UIS-RNN.</p>\n", "bases": "torch.nn.modules.module.Module"}, {"fullname": "uisrnn.uisrnn.CoreRNN.__init__", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.__init__", "kind": "function", "doc": "<p>Initializes internal Module state, shared by both nn.Module and ScriptModule.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_dim</span>, </span><span class=\"param\"><span class=\"n\">hidden_size</span>, </span><span class=\"param\"><span class=\"n\">depth</span>, </span><span class=\"param\"><span class=\"n\">observation_dim</span>, </span><span class=\"param\"><span class=\"n\">dropout</span><span class=\"o\">=</span><span class=\"mi\">0</span></span>)</span>"}, {"fullname": "uisrnn.uisrnn.CoreRNN.hidden_size", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.hidden_size", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN.linear_mean1", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.linear_mean1", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN.linear_mean2", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.linear_mean2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN.forward", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.forward", "kind": "function", "doc": "<p>The forward function of the module.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">input_seq</span>, </span><span class=\"param\"><span class=\"n\">hidden</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.BeamState", "modulename": "uisrnn.uisrnn", "qualname": "BeamState", "kind": "class", "doc": "<p>Structure that contains necessary states for beam search.</p>\n"}, {"fullname": "uisrnn.uisrnn.BeamState.__init__", "modulename": "uisrnn.uisrnn", "qualname": "BeamState.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">source</span><span class=\"o\">=</span><span class=\"kc\">None</span></span>)</span>"}, {"fullname": "uisrnn.uisrnn.BeamState.append", "modulename": "uisrnn.uisrnn", "qualname": "BeamState.append", "kind": "function", "doc": "<p>Append new item to the BeamState.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">mean</span>, </span><span class=\"param\"><span class=\"n\">hidden</span>, </span><span class=\"param\"><span class=\"n\">cluster</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN", "kind": "class", "doc": "<p>Unbounded Interleaved-State Recurrent Neural Networks.</p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.__init__", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.__init__", "kind": "function", "doc": "<p>Construct the UISRNN object.</p>\n\n<p>Args:\n  args: Model configurations. See <code>arguments.py</code> for details.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span>)</span>"}, {"fullname": "uisrnn.uisrnn.UISRNN.observation_dim", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.observation_dim", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.device", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.device", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.rnn_model", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.rnn_model", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.rnn_init_hidden", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.rnn_init_hidden", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.estimate_sigma2", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.estimate_sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.estimate_transition_bias", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.estimate_transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.sigma2", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.transition_bias", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.transition_bias_denominator", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.transition_bias_denominator", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.crp_alpha", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.crp_alpha", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.logger", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.logger", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.save", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.save", "kind": "function", "doc": "<p>Save the model to a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.load", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.load", "kind": "function", "doc": "<p>Load the model from a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.fit_concatenated", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.fit_concatenated", "kind": "function", "doc": "<p>Fit UISRNN model to concatenated sequence and cluster_id.</p>\n\n<p>Args:\n  train_sequence: the training observation sequence, which is a\n    2-dim numpy array of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: summation of lengths of all utterances.\n- `D`: observation dimension.\n\nFor example,\n</code></pre>\n\n<p><pre><code>train_sequence =\n[[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance 'iaaa'\n [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance 'ibbb'\n [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'</p>\n\n</code></pre>\n    Here `N=5`, `D=4`.\n<pre><code>We concatenate all training utterances into this single sequence.\n\n<p></code></pre>\n  train_cluster_id: the speaker id sequence, which is 1-dim list or\n    numpy array of strings, of size <code>N</code>.\n    For example,\n  <pre><code>train_cluster_id =\n  ['iaaa_0', 'iaaa_1', 'iaaa_0', 'ibbb_0', 'ibbb_0']\n</code></pre>\n    'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.</p>\n\n<pre><code>Note that the order of entries within an utterance are preserved,\nand all utterances are simply concatenated together.\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequence or train_cluster_id is of wrong type.\n  ValueError: If train_sequence or train_cluster_id has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequence</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_id</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.fit", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.fit", "kind": "function", "doc": "<p>Fit UISRNN model.</p>\n\n<p>Args:\n  train_sequences: Either a list of training sequences, or a single\n    concatenated training sequence:</p>\n\n<pre><code>1. train_sequences is list, and each element is a 2-dim numpy array\n   of real numbers, of size: `length * D`.\n   The length varies among different sequences, but the D is the same.\n   In speaker diarization, each sequence is the sequence of speaker\n   embeddings of one utterance.\n2. train_sequences is a single concatenated sequence, which is a\n   2-dim numpy array of real numbers. See `fit_concatenated()`\n   for more details.\n</code></pre>\n\n<p>train_cluster_ids: Ground truth labels for train_sequences:</p>\n\n<pre><code>1. if train_sequences is a list, this must also be a list of the same\n   size, each element being a 1-dim list or numpy array of strings.\n2. if train_sequences is a single concatenated sequence, this\n   must also be the concatenated 1-dim list or numpy array of strings\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequences or train_cluster_ids is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequences</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_ids</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.predict_single", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.predict_single", "kind": "function", "doc": "<p>Predict labels for a single test sequence using UISRNN model.</p>\n\n<p>Args:\n  test_sequence: the test observation sequence, which is 2-dim numpy array\n    of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: length of one test utterance.\n- `D` : observation dimension.\n\nFor example:\n</code></pre>\n\n<p><pre><code>test_sequence =\n[[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance 'iccc'\n [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance 'iccc'\n [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance 'iccc'\n [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance 'iccc'\n [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance 'iccc'\n</code></pre>\n    Here <code>N=5</code>, <code>D=4</code>.\n  args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_id: predicted speaker id sequence, which is\n    an array of integers, of size <code>N</code>.\n    For example, <code>predicted_cluster_id = [0, 1, 0, 0, 1]</code></p>\n\n<p>Raises:\n  TypeError: If test_sequence is of wrong type.\n  ValueError: If test_sequence has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequence</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.predict", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.predict", "kind": "function", "doc": "<p>Predict labels for a single or many test sequences using UISRNN model.</p>\n\n<p>Args:\n  test_sequences: Either a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_ids: Predicted labels for test_sequences.</p>\n\n<pre><code>1. if test_sequences is a list, predicted_cluster_ids will be a list\n   of the same size, where each element being a 1-dim list of strings.\n2. if test_sequences is a single sequence, predicted_cluster_ids will\n   be a 1-dim list of strings\n</code></pre>\n\n<p>Raises:\n  TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.parallel_predict", "modulename": "uisrnn.uisrnn", "qualname": "parallel_predict", "kind": "function", "doc": "<p>Run prediction in parallel using torch.multiprocessing.</p>\n\n<p>This is a beta feature. It makes prediction slower on CPU. But it's reported\nthat it makes prediction faster on GPU.</p>\n\n<p>Args:\n  model: instance of UISRNN model\n  test_sequences: a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.\n  num_processes: number of parallel processes.</p>\n\n<p>Returns:\n  a list of the same size as test_sequences, where each element\n  being a 1-dim list of strings.</p>\n\n<p>Raises:\n    TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">num_processes</span><span class=\"o\">=</span><span class=\"mi\">4</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils", "modulename": "uisrnn.utils", "kind": "module", "doc": "<p>Utils for UIS-RNN.</p>\n"}, {"fullname": "uisrnn.utils.Logger", "modulename": "uisrnn.utils", "qualname": "Logger", "kind": "class", "doc": "<p>A class for printing logging information to screen.</p>\n"}, {"fullname": "uisrnn.utils.Logger.__init__", "modulename": "uisrnn.utils", "qualname": "Logger.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">verbosity</span></span>)</span>"}, {"fullname": "uisrnn.utils.Logger.print", "modulename": "uisrnn.utils", "qualname": "Logger.print", "kind": "function", "doc": "<p>Print a message if level is not higher than verbosity.</p>\n\n<p>Args:\n  level: the level of this message, smaller value means more important\n  message: the message to be printed</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">level</span>, </span><span class=\"param\"><span class=\"n\">message</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.generate_random_string", "modulename": "uisrnn.utils", "qualname": "generate_random_string", "kind": "function", "doc": "<p>Generate a random string of upper case letters and digits.</p>\n\n<p>Args:\n  length: length of the generated string</p>\n\n<p>Returns:\n  the generated string</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">length</span><span class=\"o\">=</span><span class=\"mi\">6</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.enforce_cluster_id_uniqueness", "modulename": "uisrnn.utils", "qualname": "enforce_cluster_id_uniqueness", "kind": "function", "doc": "<p>Enforce uniqueness of cluster id across sequences.</p>\n\n<p>Args:\n  cluster_ids: a list of 1-dim list/numpy.ndarray of strings</p>\n\n<p>Returns:\n  a new list with same length of cluster_ids</p>\n\n<p>Raises:\n  TypeError: if cluster_ids or its element has wrong type</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cluster_ids</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.concatenate_training_data", "modulename": "uisrnn.utils", "qualname": "concatenate_training_data", "kind": "function", "doc": "<p>Concatenate training data.</p>\n\n<p>Args:\n  train_sequences: a list of 2-dim numpy arrays to be concatenated\n  train_cluster_ids: a list of 1-dim list/numpy.ndarray of strings\n  enforce_uniqueness: a boolean indicated whether we should enfore uniqueness\n    to train_cluster_ids\n  shuffle: whether to randomly shuffle input order</p>\n\n<p>Returns:\n  concatenated_train_sequence: a 2-dim numpy array\n  concatenated_train_cluster_id: a list of strings</p>\n\n<p>Raises:\n  TypeError: if input has wrong type\n  ValueError: if sizes/dimensions of input or their elements are incorrect</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">train_sequences</span>,</span><span class=\"param\">\t<span class=\"n\">train_cluster_ids</span>,</span><span class=\"param\">\t<span class=\"n\">enforce_uniqueness</span><span class=\"o\">=</span><span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">shuffle</span><span class=\"o\">=</span><span class=\"kc\">True</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.sample_permuted_segments", "modulename": "uisrnn.utils", "qualname": "sample_permuted_segments", "kind": "function", "doc": "<p>Sample sequences with permuted blocks.</p>\n\n<p>Args:\n  index_sequence: (integer array, size: L)\n    - subsequence index\n    For example, index_sequence = [1,2,6,10,11,12].\n  number_samples: (integer)\n    - number of subsampled block-preserving permuted sequences.\n    For example, number_samples = 5</p>\n\n<p>Returns:\n  sampled_index_sequences: (a list of numpy arrays) - a list of subsampled\n    block-preserving permuted sequences. For example,\n  <pre><code>sampled_index_sequences =\n[[10,11,12,1,2,6],\n [6,1,2,10,11,12],\n [1,2,10,11,12,6],\n [6,1,2,10,11,12],\n [1,2,6,10,11,12]]\n</code></pre>\n    The length of \"sampled_index_sequences\" is \"number_samples\".</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">index_sequence</span>, </span><span class=\"param\"><span class=\"n\">number_samples</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.resize_sequence", "modulename": "uisrnn.utils", "qualname": "resize_sequence", "kind": "function", "doc": "<p>Resize sequences for packing and batching.</p>\n\n<p>Args:\n  sequence: (real numpy matrix, size: seq_len*obs_size) - observed sequence\n  cluster_id: (numpy vector, size: seq_len) - cluster indicator sequence\n  num_permutations: int - Number of permutations per utterance sampled.</p>\n\n<p>Returns:\n  sub_sequences: A list of numpy array, with obsevation vector from the same\n    cluster in the same list.\n  seq_lengths: The length of each cluster (+1).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sequence</span>, </span><span class=\"param\"><span class=\"n\">cluster_id</span>, </span><span class=\"param\"><span class=\"n\">num_permutations</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.pack_sequence", "modulename": "uisrnn.utils", "qualname": "pack_sequence", "kind": "function", "doc": "<p>Pack sequences for training.</p>\n\n<p>Args:\n  sub_sequences: A list of numpy array, with obsevation vector from the same\n    cluster in the same list.\n  seq_lengths: The length of each cluster (+1).\n  batch_size: int or None - Run batch learning if batch_size is None. Else,\n    run online learning with specified batch size.\n  observation_dim: int - dimension for observation vectors\n  device: str - Your device. E.g., <code>cuda:0</code> or <code>cpu</code>.</p>\n\n<p>Returns:\n  packed_rnn_input: (PackedSequence object) packed rnn input\n  rnn_truth: ground truth</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sub_sequences</span>, </span><span class=\"param\"><span class=\"n\">seq_lengths</span>, </span><span class=\"param\"><span class=\"n\">batch_size</span>, </span><span class=\"param\"><span class=\"n\">observation_dim</span>, </span><span class=\"param\"><span class=\"n\">device</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.output_result", "modulename": "uisrnn.utils", "qualname": "output_result", "kind": "function", "doc": "<p>Produce a string to summarize the experiment.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model_args</span>, </span><span class=\"param\"><span class=\"n\">training_args</span>, </span><span class=\"param\"><span class=\"n\">test_record</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.estimate_transition_bias", "modulename": "uisrnn.utils", "qualname": "estimate_transition_bias", "kind": "function", "doc": "<p>Estimate the transition bias.</p>\n\n<p>Args:\n  cluster_id: Either a list of cluster indicator sequences, or a single\n    concatenated sequence. The former is strongly preferred, since the\n    transition_bias estimated from the latter will be inaccurate.\n  smooth: int or float - Smoothing coefficient, avoids -inf value in np.log\n    in the case of a sequence with a single speaker and division by 0 in the\n    case of empty sequences. Using a small value for smooth decreases the\n    bias in the calculation of transition_bias but can also lead to underflow\n    in some remote cases, larger values are safer but less accurate.</p>\n\n<p>Returns:\n  bias: Flipping coin head probability.\n  bias_denominator: The denominator of the bias, used for multiple calls to\n    fit().</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cluster_ids</span>, </span><span class=\"param\"><span class=\"n\">smooth</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}];
+    /** pdoc search index */const docs = [{"fullname": "uisrnn", "modulename": "uisrnn", "kind": "module", "doc": "<p>The module for Unbounded Interleaved-State Recurrent Neural Network.</p>\n\n<p>An introduction is available at [README.md].</p>\n"}, {"fullname": "uisrnn.parse_arguments", "modulename": "uisrnn", "qualname": "parse_arguments", "kind": "function", "doc": "<p>Parse arguments.</p>\n\n<p>Returns:\n  A tuple of:</p>\n\n<pre><code>- `model_args`: model arguments\n- `training_args`: training arguments\n- `inference_args`: inference arguments\n</code></pre>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.compute_sequence_match_accuracy", "modulename": "uisrnn", "qualname": "compute_sequence_match_accuracy", "kind": "function", "doc": "<p>Compute the accuracy between two sequences by finding optimal matching.</p>\n\n<p>Args:\n  sequence1: A list of integers or strings.\n  sequence2: A list of integers or strings.</p>\n\n<p>Returns:\n  accuracy: sequence matching accuracy as a number in [0.0, 1.0]</p>\n\n<p>Raises:\n  TypeError: If sequence1 or sequence2 is not list.\n  ValueError: If sequence1 and sequence2 are not same size.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sequence1</span>, </span><span class=\"param\"><span class=\"n\">sequence2</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.output_result", "modulename": "uisrnn", "qualname": "output_result", "kind": "function", "doc": "<p>Produce a string to summarize the experiment.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model_args</span>, </span><span class=\"param\"><span class=\"n\">training_args</span>, </span><span class=\"param\"><span class=\"n\">test_record</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN", "modulename": "uisrnn", "qualname": "UISRNN", "kind": "class", "doc": "<p>Unbounded Interleaved-State Recurrent Neural Networks.</p>\n"}, {"fullname": "uisrnn.UISRNN.__init__", "modulename": "uisrnn", "qualname": "UISRNN.__init__", "kind": "function", "doc": "<p>Construct the UISRNN object.</p>\n\n<p>Args:\n  args: Model configurations. See <code>arguments.py</code> for details.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span>)</span>"}, {"fullname": "uisrnn.UISRNN.observation_dim", "modulename": "uisrnn", "qualname": "UISRNN.observation_dim", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.device", "modulename": "uisrnn", "qualname": "UISRNN.device", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.rnn_model", "modulename": "uisrnn", "qualname": "UISRNN.rnn_model", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.rnn_init_hidden", "modulename": "uisrnn", "qualname": "UISRNN.rnn_init_hidden", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.estimate_sigma2", "modulename": "uisrnn", "qualname": "UISRNN.estimate_sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.estimate_transition_bias", "modulename": "uisrnn", "qualname": "UISRNN.estimate_transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.sigma2", "modulename": "uisrnn", "qualname": "UISRNN.sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.transition_bias", "modulename": "uisrnn", "qualname": "UISRNN.transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.transition_bias_denominator", "modulename": "uisrnn", "qualname": "UISRNN.transition_bias_denominator", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.crp_alpha", "modulename": "uisrnn", "qualname": "UISRNN.crp_alpha", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.logger", "modulename": "uisrnn", "qualname": "UISRNN.logger", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.UISRNN.save", "modulename": "uisrnn", "qualname": "UISRNN.save", "kind": "function", "doc": "<p>Save the model to a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.load", "modulename": "uisrnn", "qualname": "UISRNN.load", "kind": "function", "doc": "<p>Load the model from a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.fit_concatenated", "modulename": "uisrnn", "qualname": "UISRNN.fit_concatenated", "kind": "function", "doc": "<p>Fit UISRNN model to concatenated sequence and cluster_id.</p>\n\n<p>Args:\n  train_sequence: the training observation sequence, which is a\n    2-dim numpy array of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: summation of lengths of all utterances.\n- `D`: observation dimension.\n\nFor example,\n</code></pre>\n\n<p><pre><code>train_sequence =\n[[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance 'iaaa'\n [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance 'ibbb'\n [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'\n</code></pre></p>\n\n<pre><code>Here `N=5`, `D=4`.\n\nWe concatenate all training utterances into this single sequence.\n</code></pre>\n\n<p>train_cluster_id: the speaker id sequence, which is 1-dim list or\n    numpy array of strings, of size <code>N</code>.\n    For example,</p>\n\n<p><pre><code>train_cluster_id =\n  ['iaaa_0', 'iaaa_1', 'iaaa_0', 'ibbb_0', 'ibbb_0']\n</code></pre></p>\n\n<pre><code>'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.\n\nNote that the order of entries within an utterance are preserved,\nand all utterances are simply concatenated together.\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequence or train_cluster_id is of wrong type.\n  ValueError: If train_sequence or train_cluster_id has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequence</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_id</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.fit", "modulename": "uisrnn", "qualname": "UISRNN.fit", "kind": "function", "doc": "<p>Fit UISRNN model.</p>\n\n<p>Args:\n  train_sequences: Either a list of training sequences, or a single\n    concatenated training sequence:</p>\n\n<pre><code>1. train_sequences is list, and each element is a 2-dim numpy array\n   of real numbers, of size: `length * D`.\n   The length varies among different sequences, but the D is the same.\n   In speaker diarization, each sequence is the sequence of speaker\n   embeddings of one utterance.\n2. train_sequences is a single concatenated sequence, which is a\n   2-dim numpy array of real numbers. See `fit_concatenated()`\n   for more details.\n</code></pre>\n\n<p>train_cluster_ids: Ground truth labels for train_sequences:</p>\n\n<pre><code>1. if train_sequences is a list, this must also be a list of the same\n   size, each element being a 1-dim list or numpy array of strings.\n2. if train_sequences is a single concatenated sequence, this\n   must also be the concatenated 1-dim list or numpy array of strings\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequences or train_cluster_ids is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequences</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_ids</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.predict_single", "modulename": "uisrnn", "qualname": "UISRNN.predict_single", "kind": "function", "doc": "<p>Predict labels for a single test sequence using UISRNN model.</p>\n\n<p>Args:\n  test_sequence: the test observation sequence, which is 2-dim numpy array\n    of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: length of one test utterance.\n- `D` : observation dimension.\n\nFor example:\n</code></pre>\n\n<p><pre><code>test_sequence =\n[[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance 'iccc'\n [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance 'iccc'\n [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance 'iccc'\n [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance 'iccc'\n [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance 'iccc'\n</code></pre></p>\n\n<pre><code>Here `N=5`, `D=4`.\n</code></pre>\n\n<p>args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_id: predicted speaker id sequence, which is\n    an array of integers, of size <code>N</code>.\n    For example, <code>predicted_cluster_id = [0, 1, 0, 0, 1]</code></p>\n\n<p>Raises:\n  TypeError: If test_sequence is of wrong type.\n  ValueError: If test_sequence has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequence</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.UISRNN.predict", "modulename": "uisrnn", "qualname": "UISRNN.predict", "kind": "function", "doc": "<p>Predict labels for a single or many test sequences using UISRNN model.</p>\n\n<p>Args:\n  test_sequences: Either a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_ids: Predicted labels for test_sequences.</p>\n\n<pre><code>1. if test_sequences is a list, predicted_cluster_ids will be a list\n   of the same size, where each element being a 1-dim list of strings.\n2. if test_sequences is a single sequence, predicted_cluster_ids will\n   be a 1-dim list of strings\n</code></pre>\n\n<p>Raises:\n  TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.parallel_predict", "modulename": "uisrnn", "qualname": "parallel_predict", "kind": "function", "doc": "<p>Run prediction in parallel using torch.multiprocessing.</p>\n\n<p>This is a beta feature. It makes prediction slower on CPU. But it's reported\nthat it makes prediction faster on GPU.</p>\n\n<p>Args:\n  model: instance of UISRNN model\n  test_sequences: a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.\n  num_processes: number of parallel processes.</p>\n\n<p>Returns:\n  a list of the same size as test_sequences, where each element\n  being a 1-dim list of strings.</p>\n\n<p>Raises:\n    TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">num_processes</span><span class=\"o\">=</span><span class=\"mi\">4</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.arguments", "modulename": "uisrnn.arguments", "kind": "module", "doc": "<p>Arguments for UISRNN.</p>\n"}, {"fullname": "uisrnn.arguments.str2bool", "modulename": "uisrnn.arguments", "qualname": "str2bool", "kind": "function", "doc": "<p>A function to convert string to bool value.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">value</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.arguments.parse_arguments", "modulename": "uisrnn.arguments", "qualname": "parse_arguments", "kind": "function", "doc": "<p>Parse arguments.</p>\n\n<p>Returns:\n  A tuple of:</p>\n\n<pre><code>- `model_args`: model arguments\n- `training_args`: training arguments\n- `inference_args`: inference arguments\n</code></pre>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.contrib", "modulename": "uisrnn.contrib", "kind": "module", "doc": "<p>The module for community contributed code.</p>\n\n<p>An introduction is available at [README.md].</p>\n"}, {"fullname": "uisrnn.contrib.contrib_template", "modulename": "uisrnn.contrib.contrib_template", "kind": "module", "doc": "<p>This is a template for community contributions.</p>\n"}, {"fullname": "uisrnn.contrib.contrib_template.example_function", "modulename": "uisrnn.contrib.contrib_template", "qualname": "example_function", "kind": "function", "doc": "<p>This is an example function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.contrib.range_search_crp_alpha", "modulename": "uisrnn.contrib.range_search_crp_alpha", "kind": "module", "doc": "<p>This module implements method to search for best crp_alpha within a range for\na given data set.\n For example</p>\n\n<p><pre><code>  train_cluster_id = np.array(\n    ['0_0', '0_0', '0_1', '0_1', '0_1', '0_0', '0_0', '1_0', '1_0', '1_0',\n    '1_1', '1_1', '1_1', '1_0', '1_0','1_0', '1_2', '1_2', '1_2'])\n  print(estimate_crp_alpha(train_cluster_id))\n  0.5\n</code></pre></p>\n\n<p>Function for user:\n   estimate_crp_alpha: see docstring for details.\n Internal functions:\n   _get_cdf: see docstring for details.\n   _get_cdf_single: see docstring for details.\n   _get_k_t: see docstring for details.\n   _get_n_kt: see docstring for details.\n   _get_cluster_id_single: see docstring for details.\n   _get_normalized_id: see docstring for details.</p>\n"}, {"fullname": "uisrnn.contrib.range_search_crp_alpha.estimate_crp_alpha", "modulename": "uisrnn.contrib.range_search_crp_alpha", "qualname": "estimate_crp_alpha", "kind": "function", "doc": "<p>Iterate through a range of alpha, return alpha with maximum cdf P{Y|Z}.</p>\n\n<p>Args:\n  train_cluster_id: same as train_cluster_id in demo.py. See <code>demo.py</code> for\n    details.\n  search_range: the range to search for crp_alpha.\n  search_step: the step to search for crp_alpha.\nReturns:\n  cur_alpha: a float variable.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">train_cluster_id</span>, </span><span class=\"param\"><span class=\"n\">search_range</span><span class=\"o\">=</span><span class=\"mi\">1</span>, </span><span class=\"param\"><span class=\"n\">search_step</span><span class=\"o\">=</span><span class=\"mf\">0.01</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.evals", "modulename": "uisrnn.evals", "kind": "module", "doc": "<p>Utils for model evaluation.</p>\n"}, {"fullname": "uisrnn.evals.get_list_inverse_index", "modulename": "uisrnn.evals", "qualname": "get_list_inverse_index", "kind": "function", "doc": "<p>Get value to position index from a list of unique ids.</p>\n\n<p>Args:\n  unique_ids: A list of unique integers of strings.</p>\n\n<p>Returns:\n  result: a dict from value to position</p>\n\n<p>Raises:\n  TypeError: If unique_ids is not a list.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">unique_ids</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.evals.compute_sequence_match_accuracy", "modulename": "uisrnn.evals", "qualname": "compute_sequence_match_accuracy", "kind": "function", "doc": "<p>Compute the accuracy between two sequences by finding optimal matching.</p>\n\n<p>Args:\n  sequence1: A list of integers or strings.\n  sequence2: A list of integers or strings.</p>\n\n<p>Returns:\n  accuracy: sequence matching accuracy as a number in [0.0, 1.0]</p>\n\n<p>Raises:\n  TypeError: If sequence1 or sequence2 is not list.\n  ValueError: If sequence1 and sequence2 are not same size.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sequence1</span>, </span><span class=\"param\"><span class=\"n\">sequence2</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.loss_func", "modulename": "uisrnn.loss_func", "kind": "module", "doc": "<p>Loss functions for training.</p>\n"}, {"fullname": "uisrnn.loss_func.weighted_mse_loss", "modulename": "uisrnn.loss_func", "qualname": "weighted_mse_loss", "kind": "function", "doc": "<p>Compute weighted MSE loss.</p>\n\n<p>Note that we are doing weighted loss that only sum up over non-zero entries.</p>\n\n<p>Args:\n  input_tensor: input tensor\n  target_tensor: target tensor\n  weight: weight tensor, in this case 1/sigma^2</p>\n\n<p>Returns:\n  the weighted MSE loss</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_tensor</span>, </span><span class=\"param\"><span class=\"n\">target_tensor</span>, </span><span class=\"param\"><span class=\"n\">weight</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.loss_func.sigma2_prior_loss", "modulename": "uisrnn.loss_func", "qualname": "sigma2_prior_loss", "kind": "function", "doc": "<p>Compute sigma2 prior loss.</p>\n\n<p>Args:\n  num_non_zero: since rnn_truth is a collection of different length sequences\n      padded with zeros to fit them into a tensor, we count the sum of\n      'real lengths' of all sequences\n  sigma_alpha: inverse gamma shape\n  sigma_beta: inverse gamma scale\n  sigma2: sigma squared</p>\n\n<p>Returns:\n  the sigma2 prior loss</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">num_non_zero</span>, </span><span class=\"param\"><span class=\"n\">sigma_alpha</span>, </span><span class=\"param\"><span class=\"n\">sigma_beta</span>, </span><span class=\"param\"><span class=\"n\">sigma2</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.loss_func.regularization_loss", "modulename": "uisrnn.loss_func", "qualname": "regularization_loss", "kind": "function", "doc": "<p>Compute regularization loss.</p>\n\n<p>Args:\n  params: iterable of all parameters\n  weight: weight for the regularization term</p>\n\n<p>Returns:\n  the regularization loss</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">params</span>, </span><span class=\"param\"><span class=\"n\">weight</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn", "modulename": "uisrnn.uisrnn", "kind": "module", "doc": "<p>The UIS-RNN model.</p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN", "kind": "class", "doc": "<p>The core Recurent Neural Network used by UIS-RNN.</p>\n", "bases": "torch.nn.modules.module.Module"}, {"fullname": "uisrnn.uisrnn.CoreRNN.__init__", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.__init__", "kind": "function", "doc": "<p>Initialize internal Module state, shared by both nn.Module and ScriptModule.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_dim</span>, </span><span class=\"param\"><span class=\"n\">hidden_size</span>, </span><span class=\"param\"><span class=\"n\">depth</span>, </span><span class=\"param\"><span class=\"n\">observation_dim</span>, </span><span class=\"param\"><span class=\"n\">dropout</span><span class=\"o\">=</span><span class=\"mi\">0</span></span>)</span>"}, {"fullname": "uisrnn.uisrnn.CoreRNN.hidden_size", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.hidden_size", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN.linear_mean1", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.linear_mean1", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN.linear_mean2", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.linear_mean2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.CoreRNN.forward", "modulename": "uisrnn.uisrnn", "qualname": "CoreRNN.forward", "kind": "function", "doc": "<p>The forward function of the module.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">input_seq</span>, </span><span class=\"param\"><span class=\"n\">hidden</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.BeamState", "modulename": "uisrnn.uisrnn", "qualname": "BeamState", "kind": "class", "doc": "<p>Structure that contains necessary states for beam search.</p>\n"}, {"fullname": "uisrnn.uisrnn.BeamState.__init__", "modulename": "uisrnn.uisrnn", "qualname": "BeamState.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">source</span><span class=\"o\">=</span><span class=\"kc\">None</span></span>)</span>"}, {"fullname": "uisrnn.uisrnn.BeamState.append", "modulename": "uisrnn.uisrnn", "qualname": "BeamState.append", "kind": "function", "doc": "<p>Append new item to the BeamState.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">mean</span>, </span><span class=\"param\"><span class=\"n\">hidden</span>, </span><span class=\"param\"><span class=\"n\">cluster</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN", "kind": "class", "doc": "<p>Unbounded Interleaved-State Recurrent Neural Networks.</p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.__init__", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.__init__", "kind": "function", "doc": "<p>Construct the UISRNN object.</p>\n\n<p>Args:\n  args: Model configurations. See <code>arguments.py</code> for details.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span>)</span>"}, {"fullname": "uisrnn.uisrnn.UISRNN.observation_dim", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.observation_dim", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.device", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.device", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.rnn_model", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.rnn_model", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.rnn_init_hidden", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.rnn_init_hidden", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.estimate_sigma2", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.estimate_sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.estimate_transition_bias", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.estimate_transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.sigma2", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.sigma2", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.transition_bias", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.transition_bias", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.transition_bias_denominator", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.transition_bias_denominator", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.crp_alpha", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.crp_alpha", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.logger", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.logger", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "uisrnn.uisrnn.UISRNN.save", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.save", "kind": "function", "doc": "<p>Save the model to a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.load", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.load", "kind": "function", "doc": "<p>Load the model from a file.</p>\n\n<p>Args:\n  filepath: the path of the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">filepath</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.fit_concatenated", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.fit_concatenated", "kind": "function", "doc": "<p>Fit UISRNN model to concatenated sequence and cluster_id.</p>\n\n<p>Args:\n  train_sequence: the training observation sequence, which is a\n    2-dim numpy array of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: summation of lengths of all utterances.\n- `D`: observation dimension.\n\nFor example,\n</code></pre>\n\n<p><pre><code>train_sequence =\n[[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance 'iaaa'\n [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance 'iaaa'\n [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance 'ibbb'\n [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'\n</code></pre></p>\n\n<pre><code>Here `N=5`, `D=4`.\n\nWe concatenate all training utterances into this single sequence.\n</code></pre>\n\n<p>train_cluster_id: the speaker id sequence, which is 1-dim list or\n    numpy array of strings, of size <code>N</code>.\n    For example,</p>\n\n<p><pre><code>train_cluster_id =\n  ['iaaa_0', 'iaaa_1', 'iaaa_0', 'ibbb_0', 'ibbb_0']\n</code></pre></p>\n\n<pre><code>'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.\n\nNote that the order of entries within an utterance are preserved,\nand all utterances are simply concatenated together.\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequence or train_cluster_id is of wrong type.\n  ValueError: If train_sequence or train_cluster_id has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequence</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_id</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.fit", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.fit", "kind": "function", "doc": "<p>Fit UISRNN model.</p>\n\n<p>Args:\n  train_sequences: Either a list of training sequences, or a single\n    concatenated training sequence:</p>\n\n<pre><code>1. train_sequences is list, and each element is a 2-dim numpy array\n   of real numbers, of size: `length * D`.\n   The length varies among different sequences, but the D is the same.\n   In speaker diarization, each sequence is the sequence of speaker\n   embeddings of one utterance.\n2. train_sequences is a single concatenated sequence, which is a\n   2-dim numpy array of real numbers. See `fit_concatenated()`\n   for more details.\n</code></pre>\n\n<p>train_cluster_ids: Ground truth labels for train_sequences:</p>\n\n<pre><code>1. if train_sequences is a list, this must also be a list of the same\n   size, each element being a 1-dim list or numpy array of strings.\n2. if train_sequences is a single concatenated sequence, this\n   must also be the concatenated 1-dim list or numpy array of strings\n</code></pre>\n\n<p>args: Training configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Raises:\n  TypeError: If train_sequences or train_cluster_ids is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">train_sequences</span>, </span><span class=\"param\"><span class=\"n\">train_cluster_ids</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.predict_single", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.predict_single", "kind": "function", "doc": "<p>Predict labels for a single test sequence using UISRNN model.</p>\n\n<p>Args:\n  test_sequence: the test observation sequence, which is 2-dim numpy array\n    of real numbers, of size <code>N * D</code>.</p>\n\n<pre><code>- `N`: length of one test utterance.\n- `D` : observation dimension.\n\nFor example:\n</code></pre>\n\n<p><pre><code>test_sequence =\n[[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance 'iccc'\n [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance 'iccc'\n [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance 'iccc'\n [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance 'iccc'\n [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance 'iccc'\n</code></pre></p>\n\n<pre><code>Here `N=5`, `D=4`.\n</code></pre>\n\n<p>args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_id: predicted speaker id sequence, which is\n    an array of integers, of size <code>N</code>.\n    For example, <code>predicted_cluster_id = [0, 1, 0, 0, 1]</code></p>\n\n<p>Raises:\n  TypeError: If test_sequence is of wrong type.\n  ValueError: If test_sequence has wrong dimension.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequence</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.UISRNN.predict", "modulename": "uisrnn.uisrnn", "qualname": "UISRNN.predict", "kind": "function", "doc": "<p>Predict labels for a single or many test sequences using UISRNN model.</p>\n\n<p>Args:\n  test_sequences: Either a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.</p>\n\n<p>Returns:\n  predicted_cluster_ids: Predicted labels for test_sequences.</p>\n\n<pre><code>1. if test_sequences is a list, predicted_cluster_ids will be a list\n   of the same size, where each element being a 1-dim list of strings.\n2. if test_sequences is a single sequence, predicted_cluster_ids will\n   be a 1-dim list of strings\n</code></pre>\n\n<p>Raises:\n  TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.uisrnn.parallel_predict", "modulename": "uisrnn.uisrnn", "qualname": "parallel_predict", "kind": "function", "doc": "<p>Run prediction in parallel using torch.multiprocessing.</p>\n\n<p>This is a beta feature. It makes prediction slower on CPU. But it's reported\nthat it makes prediction faster on GPU.</p>\n\n<p>Args:\n  model: instance of UISRNN model\n  test_sequences: a list of test sequences, or a single test\n    sequence. Each test sequence is a 2-dim numpy array\n    of real numbers. See <code>predict_single()</code> for details.\n  args: Inference configurations. See <code>arguments.py</code> for details.\n  num_processes: number of parallel processes.</p>\n\n<p>Returns:\n  a list of the same size as test_sequences, where each element\n  being a 1-dim list of strings.</p>\n\n<p>Raises:\n    TypeError: If test_sequences is of wrong type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model</span>, </span><span class=\"param\"><span class=\"n\">test_sequences</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">num_processes</span><span class=\"o\">=</span><span class=\"mi\">4</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils", "modulename": "uisrnn.utils", "kind": "module", "doc": "<p>Utils for UIS-RNN.</p>\n"}, {"fullname": "uisrnn.utils.generate_random_string", "modulename": "uisrnn.utils", "qualname": "generate_random_string", "kind": "function", "doc": "<p>Generate a random string of upper case letters and digits.</p>\n\n<p>Args:\n  length: length of the generated string</p>\n\n<p>Returns:\n  the generated string</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">length</span><span class=\"o\">=</span><span class=\"mi\">6</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.enforce_cluster_id_uniqueness", "modulename": "uisrnn.utils", "qualname": "enforce_cluster_id_uniqueness", "kind": "function", "doc": "<p>Enforce uniqueness of cluster id across sequences.</p>\n\n<p>Args:\n  cluster_ids: a list of 1-dim list/numpy.ndarray of strings</p>\n\n<p>Returns:\n  a new list with same length of cluster_ids</p>\n\n<p>Raises:\n  TypeError: if cluster_ids or its element has wrong type</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cluster_ids</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.concatenate_training_data", "modulename": "uisrnn.utils", "qualname": "concatenate_training_data", "kind": "function", "doc": "<p>Concatenate training data.</p>\n\n<p>Args:\n  train_sequences: a list of 2-dim numpy arrays to be concatenated\n  train_cluster_ids: a list of 1-dim list/numpy.ndarray of strings\n  enforce_uniqueness: a boolean indicated whether we should enfore uniqueness\n    to train_cluster_ids\n  shuffle: whether to randomly shuffle input order</p>\n\n<p>Returns:\n  concatenated_train_sequence: a 2-dim numpy array\n  concatenated_train_cluster_id: a list of strings</p>\n\n<p>Raises:\n  TypeError: if input has wrong type\n  ValueError: if sizes/dimensions of input or their elements are incorrect</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">train_sequences</span>,</span><span class=\"param\">\t<span class=\"n\">train_cluster_ids</span>,</span><span class=\"param\">\t<span class=\"n\">enforce_uniqueness</span><span class=\"o\">=</span><span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">shuffle</span><span class=\"o\">=</span><span class=\"kc\">True</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.sample_permuted_segments", "modulename": "uisrnn.utils", "qualname": "sample_permuted_segments", "kind": "function", "doc": "<p>Sample sequences with permuted blocks.</p>\n\n<p>Args:\n  index_sequence: (integer array, size: L)\n    - subsequence index\n    For example, index_sequence = [1,2,6,10,11,12].\n  number_samples: (integer)\n    - number of subsampled block-preserving permuted sequences.\n    For example, number_samples = 5</p>\n\n<p>Returns:\n  sampled_index_sequences: (a list of numpy arrays) - a list of subsampled\n    block-preserving permuted sequences. For example,</p>\n\n<p><pre><code>sampled_index_sequences =\n[[10,11,12,1,2,6],\n [6,1,2,10,11,12],\n [1,2,10,11,12,6],\n [6,1,2,10,11,12],\n [1,2,6,10,11,12]]\n</code></pre></p>\n\n<pre><code>The length of \"sampled_index_sequences\" is \"number_samples\".\n</code></pre>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">index_sequence</span>, </span><span class=\"param\"><span class=\"n\">number_samples</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.resize_sequence", "modulename": "uisrnn.utils", "qualname": "resize_sequence", "kind": "function", "doc": "<p>Resize sequences for packing and batching.</p>\n\n<p>Args:\n  sequence: (real numpy matrix, size: seq_len*obs_size) - observed sequence\n  cluster_id: (numpy vector, size: seq_len) - cluster indicator sequence\n  num_permutations: int - Number of permutations per utterance sampled.</p>\n\n<p>Returns:\n  sub_sequences: A list of numpy array, with obsevation vector from the same\n    cluster in the same list.\n  seq_lengths: The length of each cluster (+1).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sequence</span>, </span><span class=\"param\"><span class=\"n\">cluster_id</span>, </span><span class=\"param\"><span class=\"n\">num_permutations</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.pack_sequence", "modulename": "uisrnn.utils", "qualname": "pack_sequence", "kind": "function", "doc": "<p>Pack sequences for training.</p>\n\n<p>Args:\n  sub_sequences: A list of numpy array, with obsevation vector from the same\n    cluster in the same list.\n  seq_lengths: The length of each cluster (+1).\n  batch_size: int or None - Run batch learning if batch_size is None. Else,\n    run online learning with specified batch size.\n  observation_dim: int - dimension for observation vectors\n  device: str - Your device. E.g., <code>cuda:0</code> or <code>cpu</code>.</p>\n\n<p>Returns:\n  packed_rnn_input: (PackedSequence object) packed rnn input\n  rnn_truth: ground truth</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">sub_sequences</span>, </span><span class=\"param\"><span class=\"n\">seq_lengths</span>, </span><span class=\"param\"><span class=\"n\">batch_size</span>, </span><span class=\"param\"><span class=\"n\">observation_dim</span>, </span><span class=\"param\"><span class=\"n\">device</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.output_result", "modulename": "uisrnn.utils", "qualname": "output_result", "kind": "function", "doc": "<p>Produce a string to summarize the experiment.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">model_args</span>, </span><span class=\"param\"><span class=\"n\">training_args</span>, </span><span class=\"param\"><span class=\"n\">test_record</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "uisrnn.utils.estimate_transition_bias", "modulename": "uisrnn.utils", "qualname": "estimate_transition_bias", "kind": "function", "doc": "<p>Estimate the transition bias.</p>\n\n<p>Args:\n  cluster_id: Either a list of cluster indicator sequences, or a single\n    concatenated sequence. The former is strongly preferred, since the\n    transition_bias estimated from the latter will be inaccurate.\n  smooth: int or float - Smoothing coefficient, avoids -inf value in np.log\n    in the case of a sequence with a single speaker and division by 0 in the\n    case of empty sequences. Using a small value for smooth decreases the\n    bias in the calculation of transition_bias but can also lead to underflow\n    in some remote cases, larger values are safer but less accurate.</p>\n\n<p>Returns:\n  bias: Flipping coin head probability.\n  bias_denominator: The denominator of the bias, used for multiple calls to\n    fit().</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cluster_ids</span>, </span><span class=\"param\"><span class=\"n\">smooth</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}];
 
     // mirrored in build-search-index.js (part 1)
     // Also split on html tags. this is a cheap heuristic, but good enough.
diff --git a/docs/uisrnn.html b/docs/uisrnn.html
index ff7f5db..9b922a4 100644
--- a/docs/uisrnn.html
+++ b/docs/uisrnn.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
@@ -153,16 +153,14 @@ <h1 class="modulename">
 </span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>
 </span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a><span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">arguments</span>
 </span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a><span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">evals</span>
-</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a><span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">loss_func</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">uisrnn</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a><span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">utils</span>
-</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>
-</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a><span class="c1">#pylint: disable=C0103</span>
-</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a><span class="n">parse_arguments</span> <span class="o">=</span> <span class="n">arguments</span><span class="o">.</span><span class="n">parse_arguments</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a><span class="n">compute_sequence_match_accuracy</span> <span class="o">=</span> <span class="n">evals</span><span class="o">.</span><span class="n">compute_sequence_match_accuracy</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a><span class="n">output_result</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">output_result</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a><span class="n">UISRNN</span> <span class="o">=</span> <span class="n">uisrnn</span><span class="o">.</span><span class="n">UISRNN</span>
-</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a><span class="n">parallel_predict</span> <span class="o">=</span> <span class="n">uisrnn</span><span class="o">.</span><span class="n">parallel_predict</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a><span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">uisrnn</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="kn">from</span> <span class="nn">.</span> <span class="kn">import</span> <span class="n">utils</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a><span class="n">parse_arguments</span> <span class="o">=</span> <span class="n">arguments</span><span class="o">.</span><span class="n">parse_arguments</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a><span class="n">compute_sequence_match_accuracy</span> <span class="o">=</span> <span class="n">evals</span><span class="o">.</span><span class="n">compute_sequence_match_accuracy</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a><span class="n">output_result</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">output_result</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a><span class="n">UISRNN</span> <span class="o">=</span> <span class="n">uisrnn</span><span class="o">.</span><span class="n">UISRNN</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a><span class="n">parallel_predict</span> <span class="o">=</span> <span class="n">uisrnn</span><span class="o">.</span><span class="n">parallel_predict</span>
 </span></pre></div>
 
 
@@ -238,12 +236,12 @@ <h1 class="modulename">
 </span><span id="parse_arguments-88"><a href="#parse_arguments-88"><span class="linenos"> 88</span></a>           <span class="s1">&#39;value is None, we will estimate it from training data.&#39;</span><span class="p">)</span>
 </span><span id="parse_arguments-89"><a href="#parse_arguments-89"><span class="linenos"> 89</span></a>  <span class="n">model_parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span>
 </span><span id="parse_arguments-90"><a href="#parse_arguments-90"><span class="linenos"> 90</span></a>      <span class="s1">&#39;--verbosity&#39;</span><span class="p">,</span>
-</span><span id="parse_arguments-91"><a href="#parse_arguments-91"><span class="linenos"> 91</span></a>      <span class="n">default</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
+</span><span id="parse_arguments-91"><a href="#parse_arguments-91"><span class="linenos"> 91</span></a>      <span class="n">default</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
 </span><span id="parse_arguments-92"><a href="#parse_arguments-92"><span class="linenos"> 92</span></a>      <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span>
 </span><span id="parse_arguments-93"><a href="#parse_arguments-93"><span class="linenos"> 93</span></a>      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;How verbose will the logging information be. Higher value &#39;</span>
 </span><span id="parse_arguments-94"><a href="#parse_arguments-94"><span class="linenos"> 94</span></a>      <span class="s1">&#39;represents more verbose information. A general guideline: &#39;</span>
-</span><span id="parse_arguments-95"><a href="#parse_arguments-95"><span class="linenos"> 95</span></a>      <span class="s1">&#39;0 for errors; 1 for finishing important steps; &#39;</span>
-</span><span id="parse_arguments-96"><a href="#parse_arguments-96"><span class="linenos"> 96</span></a>      <span class="s1">&#39;2 for finishing less important steps; 3 or above for debugging &#39;</span>
+</span><span id="parse_arguments-95"><a href="#parse_arguments-95"><span class="linenos"> 95</span></a>      <span class="s1">&#39;0 for fatals; 1 for errors; 2 for finishing important steps; &#39;</span>
+</span><span id="parse_arguments-96"><a href="#parse_arguments-96"><span class="linenos"> 96</span></a>      <span class="s1">&#39;3 for finishing less important steps; 4 or above for debugging &#39;</span>
 </span><span id="parse_arguments-97"><a href="#parse_arguments-97"><span class="linenos"> 97</span></a>      <span class="s1">&#39;information.&#39;</span><span class="p">)</span>
 </span><span id="parse_arguments-98"><a href="#parse_arguments-98"><span class="linenos"> 98</span></a>  <span class="n">model_parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span>
 </span><span id="parse_arguments-99"><a href="#parse_arguments-99"><span class="linenos"> 99</span></a>      <span class="s1">&#39;--enable_cuda&#39;</span><span class="p">,</span>
@@ -445,39 +443,39 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#output_result"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="output_result-271"><a href="#output_result-271"><span class="linenos">271</span></a><span class="k">def</span> <span class="nf">output_result</span><span class="p">(</span><span class="n">model_args</span><span class="p">,</span> <span class="n">training_args</span><span class="p">,</span> <span class="n">test_record</span><span class="p">):</span>
-</span><span id="output_result-272"><a href="#output_result-272"><span class="linenos">272</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Produce a string to summarize the experiment.&quot;&quot;&quot;</span>
-</span><span id="output_result-273"><a href="#output_result-273"><span class="linenos">273</span></a>  <span class="n">accuracy_array</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">test_record</span><span class="p">)</span>
-</span><span id="output_result-274"><a href="#output_result-274"><span class="linenos">274</span></a>  <span class="n">total_accuracy</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">accuracy_array</span><span class="p">)</span>
-</span><span id="output_result-275"><a href="#output_result-275"><span class="linenos">275</span></a>  <span class="n">output_string</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
-</span><span id="output_result-276"><a href="#output_result-276"><span class="linenos">276</span></a><span class="s2">Config:</span>
-</span><span id="output_result-277"><a href="#output_result-277"><span class="linenos">277</span></a><span class="s2">  sigma_alpha: </span><span class="si">{}</span>
-</span><span id="output_result-278"><a href="#output_result-278"><span class="linenos">278</span></a><span class="s2">  sigma_beta: </span><span class="si">{}</span>
-</span><span id="output_result-279"><a href="#output_result-279"><span class="linenos">279</span></a><span class="s2">  crp_alpha: </span><span class="si">{}</span>
-</span><span id="output_result-280"><a href="#output_result-280"><span class="linenos">280</span></a><span class="s2">  learning rate: </span><span class="si">{}</span>
-</span><span id="output_result-281"><a href="#output_result-281"><span class="linenos">281</span></a><span class="s2">  regularization: </span><span class="si">{}</span>
-</span><span id="output_result-282"><a href="#output_result-282"><span class="linenos">282</span></a><span class="s2">  batch size: </span><span class="si">{}</span>
-</span><span id="output_result-283"><a href="#output_result-283"><span class="linenos">283</span></a>
-</span><span id="output_result-284"><a href="#output_result-284"><span class="linenos">284</span></a><span class="s2">Performance:</span>
-</span><span id="output_result-285"><a href="#output_result-285"><span class="linenos">285</span></a><span class="s2">  averaged accuracy: </span><span class="si">{:.6f}</span>
-</span><span id="output_result-286"><a href="#output_result-286"><span class="linenos">286</span></a><span class="s2">  accuracy numbers for all testing sequences:</span>
-</span><span id="output_result-287"><a href="#output_result-287"><span class="linenos">287</span></a><span class="s2">  &quot;&quot;&quot;</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="output_result-288"><a href="#output_result-288"><span class="linenos">288</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span>
-</span><span id="output_result-289"><a href="#output_result-289"><span class="linenos">289</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span>
-</span><span id="output_result-290"><a href="#output_result-290"><span class="linenos">290</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="output_result-291"><a href="#output_result-291"><span class="linenos">291</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span>
-</span><span id="output_result-292"><a href="#output_result-292"><span class="linenos">292</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">,</span>
-</span><span id="output_result-293"><a href="#output_result-293"><span class="linenos">293</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="output_result-294"><a href="#output_result-294"><span class="linenos">294</span></a>      <span class="n">total_accuracy</span><span class="p">)</span>
-</span><span id="output_result-295"><a href="#output_result-295"><span class="linenos">295</span></a>  <span class="k">for</span> <span class="n">accuracy</span> <span class="ow">in</span> <span class="n">accuracy_array</span><span class="p">:</span>
-</span><span id="output_result-296"><a href="#output_result-296"><span class="linenos">296</span></a>    <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">    </span><span class="si">{:.6f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy</span><span class="p">)</span>
-</span><span id="output_result-297"><a href="#output_result-297"><span class="linenos">297</span></a>  <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span> <span class="o">+</span> <span class="s1">&#39;=&#39;</span> <span class="o">*</span> <span class="mi">80</span> <span class="o">+</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="output_result-298"><a href="#output_result-298"><span class="linenos">298</span></a>  <span class="n">filename</span> <span class="o">=</span> <span class="s1">&#39;layer_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{:.1f}</span><span class="s1">_result.txt&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="output_result-299"><a href="#output_result-299"><span class="linenos">299</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="output_result-300"><a href="#output_result-300"><span class="linenos">300</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span>
-</span><span id="output_result-301"><a href="#output_result-301"><span class="linenos">301</span></a>  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s1">&#39;a&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file_object</span><span class="p">:</span>
-</span><span id="output_result-302"><a href="#output_result-302"><span class="linenos">302</span></a>    <span class="n">file_object</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">output_string</span><span class="p">)</span>
-</span><span id="output_result-303"><a href="#output_result-303"><span class="linenos">303</span></a>  <span class="k">return</span> <span class="n">output_string</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="output_result-254"><a href="#output_result-254"><span class="linenos">254</span></a><span class="k">def</span> <span class="nf">output_result</span><span class="p">(</span><span class="n">model_args</span><span class="p">,</span> <span class="n">training_args</span><span class="p">,</span> <span class="n">test_record</span><span class="p">):</span>
+</span><span id="output_result-255"><a href="#output_result-255"><span class="linenos">255</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Produce a string to summarize the experiment.&quot;&quot;&quot;</span>
+</span><span id="output_result-256"><a href="#output_result-256"><span class="linenos">256</span></a>  <span class="n">accuracy_array</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">test_record</span><span class="p">)</span>
+</span><span id="output_result-257"><a href="#output_result-257"><span class="linenos">257</span></a>  <span class="n">total_accuracy</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">accuracy_array</span><span class="p">)</span>
+</span><span id="output_result-258"><a href="#output_result-258"><span class="linenos">258</span></a>  <span class="n">output_string</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
+</span><span id="output_result-259"><a href="#output_result-259"><span class="linenos">259</span></a><span class="s2">Config:</span>
+</span><span id="output_result-260"><a href="#output_result-260"><span class="linenos">260</span></a><span class="s2">  sigma_alpha: </span><span class="si">{}</span>
+</span><span id="output_result-261"><a href="#output_result-261"><span class="linenos">261</span></a><span class="s2">  sigma_beta: </span><span class="si">{}</span>
+</span><span id="output_result-262"><a href="#output_result-262"><span class="linenos">262</span></a><span class="s2">  crp_alpha: </span><span class="si">{}</span>
+</span><span id="output_result-263"><a href="#output_result-263"><span class="linenos">263</span></a><span class="s2">  learning rate: </span><span class="si">{}</span>
+</span><span id="output_result-264"><a href="#output_result-264"><span class="linenos">264</span></a><span class="s2">  regularization: </span><span class="si">{}</span>
+</span><span id="output_result-265"><a href="#output_result-265"><span class="linenos">265</span></a><span class="s2">  batch size: </span><span class="si">{}</span>
+</span><span id="output_result-266"><a href="#output_result-266"><span class="linenos">266</span></a>
+</span><span id="output_result-267"><a href="#output_result-267"><span class="linenos">267</span></a><span class="s2">Performance:</span>
+</span><span id="output_result-268"><a href="#output_result-268"><span class="linenos">268</span></a><span class="s2">  averaged accuracy: </span><span class="si">{:.6f}</span>
+</span><span id="output_result-269"><a href="#output_result-269"><span class="linenos">269</span></a><span class="s2">  accuracy numbers for all testing sequences:</span>
+</span><span id="output_result-270"><a href="#output_result-270"><span class="linenos">270</span></a><span class="s2">  &quot;&quot;&quot;</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="output_result-271"><a href="#output_result-271"><span class="linenos">271</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span>
+</span><span id="output_result-272"><a href="#output_result-272"><span class="linenos">272</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span>
+</span><span id="output_result-273"><a href="#output_result-273"><span class="linenos">273</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="output_result-274"><a href="#output_result-274"><span class="linenos">274</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span>
+</span><span id="output_result-275"><a href="#output_result-275"><span class="linenos">275</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">,</span>
+</span><span id="output_result-276"><a href="#output_result-276"><span class="linenos">276</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="output_result-277"><a href="#output_result-277"><span class="linenos">277</span></a>      <span class="n">total_accuracy</span><span class="p">)</span>
+</span><span id="output_result-278"><a href="#output_result-278"><span class="linenos">278</span></a>  <span class="k">for</span> <span class="n">accuracy</span> <span class="ow">in</span> <span class="n">accuracy_array</span><span class="p">:</span>
+</span><span id="output_result-279"><a href="#output_result-279"><span class="linenos">279</span></a>    <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">    </span><span class="si">{:.6f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy</span><span class="p">)</span>
+</span><span id="output_result-280"><a href="#output_result-280"><span class="linenos">280</span></a>  <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span> <span class="o">+</span> <span class="s1">&#39;=&#39;</span> <span class="o">*</span> <span class="mi">80</span> <span class="o">+</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="output_result-281"><a href="#output_result-281"><span class="linenos">281</span></a>  <span class="n">filename</span> <span class="o">=</span> <span class="s1">&#39;layer_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{:.1f}</span><span class="s1">_result.txt&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="output_result-282"><a href="#output_result-282"><span class="linenos">282</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="output_result-283"><a href="#output_result-283"><span class="linenos">283</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span>
+</span><span id="output_result-284"><a href="#output_result-284"><span class="linenos">284</span></a>  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s1">&#39;a&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file_object</span><span class="p">:</span>
+</span><span id="output_result-285"><a href="#output_result-285"><span class="linenos">285</span></a>    <span class="n">file_object</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">output_string</span><span class="p">)</span>
+</span><span id="output_result-286"><a href="#output_result-286"><span class="linenos">286</span></a>  <span class="k">return</span> <span class="n">output_string</span>
 </span></pre></div>
 
 
@@ -497,517 +495,517 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN-80"><a href="#UISRNN-80"><span class="linenos"> 80</span></a><span class="k">class</span> <span class="nc">UISRNN</span><span class="p">:</span>
-</span><span id="UISRNN-81"><a href="#UISRNN-81"><span class="linenos"> 81</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Unbounded Interleaved-State Recurrent Neural Networks.&quot;&quot;&quot;</span>
-</span><span id="UISRNN-82"><a href="#UISRNN-82"><span class="linenos"> 82</span></a>
-</span><span id="UISRNN-83"><a href="#UISRNN-83"><span class="linenos"> 83</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-84"><a href="#UISRNN-84"><span class="linenos"> 84</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
-</span><span id="UISRNN-85"><a href="#UISRNN-85"><span class="linenos"> 85</span></a>
-</span><span id="UISRNN-86"><a href="#UISRNN-86"><span class="linenos"> 86</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-87"><a href="#UISRNN-87"><span class="linenos"> 87</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-88"><a href="#UISRNN-88"><span class="linenos"> 88</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-89"><a href="#UISRNN-89"><span class="linenos"> 89</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
-</span><span id="UISRNN-90"><a href="#UISRNN-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
-</span><span id="UISRNN-91"><a href="#UISRNN-91"><span class="linenos"> 91</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-92"><a href="#UISRNN-92"><span class="linenos"> 92</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="UISRNN-93"><a href="#UISRNN-93"><span class="linenos"> 93</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN-94"><a href="#UISRNN-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-95"><a href="#UISRNN-95"><span class="linenos"> 95</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-96"><a href="#UISRNN-96"><span class="linenos"> 96</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-97"><a href="#UISRNN-97"><span class="linenos"> 97</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
-</span><span id="UISRNN-98"><a href="#UISRNN-98"><span class="linenos"> 98</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-99"><a href="#UISRNN-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-100"><a href="#UISRNN-100"><span class="linenos">100</span></a>    <span class="c1"># initial values of variables</span>
-</span><span id="UISRNN-101"><a href="#UISRNN-101"><span class="linenos">101</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="UISRNN-102"><a href="#UISRNN-102"><span class="linenos">102</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-103"><a href="#UISRNN-103"><span class="linenos">103</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-104"><a href="#UISRNN-104"><span class="linenos">104</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
-</span><span id="UISRNN-105"><a href="#UISRNN-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="UISRNN-106"><a href="#UISRNN-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
-</span><span id="UISRNN-107"><a href="#UISRNN-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
-</span><span id="UISRNN-108"><a href="#UISRNN-108"><span class="linenos">108</span></a>
-</span><span id="UISRNN-109"><a href="#UISRNN-109"><span class="linenos">109</span></a>  <span class="k">def</span> <span class="nf">_get_optimizer</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">optimizer</span><span class="p">,</span> <span class="n">learning_rate</span><span class="p">):</span>
-</span><span id="UISRNN-110"><a href="#UISRNN-110"><span class="linenos">110</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Get optimizer for UISRNN.</span>
-</span><span id="UISRNN-111"><a href="#UISRNN-111"><span class="linenos">111</span></a>
-</span><span id="UISRNN-112"><a href="#UISRNN-112"><span class="linenos">112</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-113"><a href="#UISRNN-113"><span class="linenos">113</span></a><span class="sd">      optimizer: string - name of the optimizer.</span>
-</span><span id="UISRNN-114"><a href="#UISRNN-114"><span class="linenos">114</span></a><span class="sd">      learning_rate: - learning rate for the entire model.</span>
-</span><span id="UISRNN-115"><a href="#UISRNN-115"><span class="linenos">115</span></a><span class="sd">        We do not customize learning rate for separate parts.</span>
-</span><span id="UISRNN-116"><a href="#UISRNN-116"><span class="linenos">116</span></a>
-</span><span id="UISRNN-117"><a href="#UISRNN-117"><span class="linenos">117</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-118"><a href="#UISRNN-118"><span class="linenos">118</span></a><span class="sd">      a pytorch &quot;optim&quot; object</span>
-</span><span id="UISRNN-119"><a href="#UISRNN-119"><span class="linenos">119</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-120"><a href="#UISRNN-120"><span class="linenos">120</span></a>    <span class="n">params</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="UISRNN-121"><a href="#UISRNN-121"><span class="linenos">121</span></a>        <span class="p">{</span>
-</span><span id="UISRNN-122"><a href="#UISRNN-122"><span class="linenos">122</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
-</span><span id="UISRNN-123"><a href="#UISRNN-123"><span class="linenos">123</span></a>        <span class="p">},</span>  <span class="c1"># rnn parameters</span>
-</span><span id="UISRNN-124"><a href="#UISRNN-124"><span class="linenos">124</span></a>        <span class="p">{</span>
-</span><span id="UISRNN-125"><a href="#UISRNN-125"><span class="linenos">125</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span>
-</span><span id="UISRNN-126"><a href="#UISRNN-126"><span class="linenos">126</span></a>        <span class="p">}</span>  <span class="c1"># rnn initial hidden state</span>
-</span><span id="UISRNN-127"><a href="#UISRNN-127"><span class="linenos">127</span></a>    <span class="p">]</span>
-</span><span id="UISRNN-128"><a href="#UISRNN-128"><span class="linenos">128</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span><span class="p">:</span>  <span class="c1"># train sigma2</span>
-</span><span id="UISRNN-129"><a href="#UISRNN-129"><span class="linenos">129</span></a>      <span class="n">params</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="UISRNN-130"><a href="#UISRNN-130"><span class="linenos">130</span></a>          <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="UISRNN-131"><a href="#UISRNN-131"><span class="linenos">131</span></a>      <span class="p">})</span>  <span class="c1"># variance parameters</span>
-</span><span id="UISRNN-132"><a href="#UISRNN-132"><span class="linenos">132</span></a>    <span class="k">assert</span> <span class="n">optimizer</span> <span class="o">==</span> <span class="s1">&#39;adam&#39;</span><span class="p">,</span> <span class="s1">&#39;Only adam optimizer is supported.&#39;</span>
-</span><span id="UISRNN-133"><a href="#UISRNN-133"><span class="linenos">133</span></a>    <span class="k">return</span> <span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="UISRNN-134"><a href="#UISRNN-134"><span class="linenos">134</span></a>
-</span><span id="UISRNN-135"><a href="#UISRNN-135"><span class="linenos">135</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN-136"><a href="#UISRNN-136"><span class="linenos">136</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
-</span><span id="UISRNN-137"><a href="#UISRNN-137"><span class="linenos">137</span></a>
-</span><span id="UISRNN-138"><a href="#UISRNN-138"><span class="linenos">138</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-139"><a href="#UISRNN-139"><span class="linenos">139</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN-140"><a href="#UISRNN-140"><span class="linenos">140</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-141"><a href="#UISRNN-141"><span class="linenos">141</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
-</span><span id="UISRNN-142"><a href="#UISRNN-142"><span class="linenos">142</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
-</span><span id="UISRNN-143"><a href="#UISRNN-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
-</span><span id="UISRNN-144"><a href="#UISRNN-144"><span class="linenos">144</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN-145"><a href="#UISRNN-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
-</span><span id="UISRNN-146"><a href="#UISRNN-146"><span class="linenos">146</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="UISRNN-147"><a href="#UISRNN-147"><span class="linenos">147</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
-</span><span id="UISRNN-148"><a href="#UISRNN-148"><span class="linenos">148</span></a>
-</span><span id="UISRNN-149"><a href="#UISRNN-149"><span class="linenos">149</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN-150"><a href="#UISRNN-150"><span class="linenos">150</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
-</span><span id="UISRNN-151"><a href="#UISRNN-151"><span class="linenos">151</span></a>
-</span><span id="UISRNN-152"><a href="#UISRNN-152"><span class="linenos">152</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-153"><a href="#UISRNN-153"><span class="linenos">153</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN-154"><a href="#UISRNN-154"><span class="linenos">154</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-155"><a href="#UISRNN-155"><span class="linenos">155</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
-</span><span id="UISRNN-156"><a href="#UISRNN-156"><span class="linenos">156</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-157"><a href="#UISRNN-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-158"><a href="#UISRNN-158"><span class="linenos">158</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-159"><a href="#UISRNN-159"><span class="linenos">159</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-160"><a href="#UISRNN-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
-</span><span id="UISRNN-161"><a href="#UISRNN-161"><span class="linenos">161</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-162"><a href="#UISRNN-162"><span class="linenos">162</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-163"><a href="#UISRNN-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-164"><a href="#UISRNN-164"><span class="linenos">164</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-165"><a href="#UISRNN-165"><span class="linenos">165</span></a>
-</span><span id="UISRNN-166"><a href="#UISRNN-166"><span class="linenos">166</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-167"><a href="#UISRNN-167"><span class="linenos">167</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
-</span><span id="UISRNN-168"><a href="#UISRNN-168"><span class="linenos">168</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN-169"><a href="#UISRNN-169"><span class="linenos">169</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
-</span><span id="UISRNN-170"><a href="#UISRNN-170"><span class="linenos">170</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
-</span><span id="UISRNN-171"><a href="#UISRNN-171"><span class="linenos">171</span></a>
-</span><span id="UISRNN-172"><a href="#UISRNN-172"><span class="linenos">172</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-173"><a href="#UISRNN-173"><span class="linenos">173</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
-</span><span id="UISRNN-174"><a href="#UISRNN-174"><span class="linenos">174</span></a>
-</span><span id="UISRNN-175"><a href="#UISRNN-175"><span class="linenos">175</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-176"><a href="#UISRNN-176"><span class="linenos">176</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
-</span><span id="UISRNN-177"><a href="#UISRNN-177"><span class="linenos">177</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN-178"><a href="#UISRNN-178"><span class="linenos">178</span></a>
-</span><span id="UISRNN-179"><a href="#UISRNN-179"><span class="linenos">179</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
-</span><span id="UISRNN-180"><a href="#UISRNN-180"><span class="linenos">180</span></a><span class="sd">        - `D`: observation dimension.</span>
-</span><span id="UISRNN-181"><a href="#UISRNN-181"><span class="linenos">181</span></a>
-</span><span id="UISRNN-182"><a href="#UISRNN-182"><span class="linenos">182</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN-183"><a href="#UISRNN-183"><span class="linenos">183</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-184"><a href="#UISRNN-184"><span class="linenos">184</span></a><span class="sd">      train_sequence =</span>
-</span><span id="UISRNN-185"><a href="#UISRNN-185"><span class="linenos">185</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN-186"><a href="#UISRNN-186"><span class="linenos">186</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN-187"><a href="#UISRNN-187"><span class="linenos">187</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN-188"><a href="#UISRNN-188"><span class="linenos">188</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN-189"><a href="#UISRNN-189"><span class="linenos">189</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN-190"><a href="#UISRNN-190"><span class="linenos">190</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-191"><a href="#UISRNN-191"><span class="linenos">191</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN-192"><a href="#UISRNN-192"><span class="linenos">192</span></a>
-</span><span id="UISRNN-193"><a href="#UISRNN-193"><span class="linenos">193</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
-</span><span id="UISRNN-194"><a href="#UISRNN-194"><span class="linenos">194</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
-</span><span id="UISRNN-195"><a href="#UISRNN-195"><span class="linenos">195</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
-</span><span id="UISRNN-196"><a href="#UISRNN-196"><span class="linenos">196</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN-197"><a href="#UISRNN-197"><span class="linenos">197</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-198"><a href="#UISRNN-198"><span class="linenos">198</span></a><span class="sd">      train_cluster_id =</span>
-</span><span id="UISRNN-199"><a href="#UISRNN-199"><span class="linenos">199</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
-</span><span id="UISRNN-200"><a href="#UISRNN-200"><span class="linenos">200</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-201"><a href="#UISRNN-201"><span class="linenos">201</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
-</span><span id="UISRNN-202"><a href="#UISRNN-202"><span class="linenos">202</span></a>
-</span><span id="UISRNN-203"><a href="#UISRNN-203"><span class="linenos">203</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
-</span><span id="UISRNN-204"><a href="#UISRNN-204"><span class="linenos">204</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
-</span><span id="UISRNN-205"><a href="#UISRNN-205"><span class="linenos">205</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-206"><a href="#UISRNN-206"><span class="linenos">206</span></a>
-</span><span id="UISRNN-207"><a href="#UISRNN-207"><span class="linenos">207</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-208"><a href="#UISRNN-208"><span class="linenos">208</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
-</span><span id="UISRNN-209"><a href="#UISRNN-209"><span class="linenos">209</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
-</span><span id="UISRNN-210"><a href="#UISRNN-210"><span class="linenos">210</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-211"><a href="#UISRNN-211"><span class="linenos">211</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN-212"><a href="#UISRNN-212"><span class="linenos">212</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN-213"><a href="#UISRNN-213"><span class="linenos">213</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN-214"><a href="#UISRNN-214"><span class="linenos">214</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-215"><a href="#UISRNN-215"><span class="linenos">215</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN-216"><a href="#UISRNN-216"><span class="linenos">216</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
-</span><span id="UISRNN-217"><a href="#UISRNN-217"><span class="linenos">217</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN-218"><a href="#UISRNN-218"><span class="linenos">218</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
-</span><span id="UISRNN-219"><a href="#UISRNN-219"><span class="linenos">219</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-220"><a href="#UISRNN-220"><span class="linenos">220</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN-221"><a href="#UISRNN-221"><span class="linenos">221</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN-222"><a href="#UISRNN-222"><span class="linenos">222</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-223"><a href="#UISRNN-223"><span class="linenos">223</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="UISRNN-224"><a href="#UISRNN-224"><span class="linenos">224</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-225"><a href="#UISRNN-225"><span class="linenos">225</span></a>    <span class="c1"># check length and size</span>
-</span><span id="UISRNN-226"><a href="#UISRNN-226"><span class="linenos">226</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN-227"><a href="#UISRNN-227"><span class="linenos">227</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN-228"><a href="#UISRNN-228"><span class="linenos">228</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN-229"><a href="#UISRNN-229"><span class="linenos">229</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-230"><a href="#UISRNN-230"><span class="linenos">230</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
-</span><span id="UISRNN-231"><a href="#UISRNN-231"><span class="linenos">231</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
-</span><span id="UISRNN-232"><a href="#UISRNN-232"><span class="linenos">232</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-233"><a href="#UISRNN-233"><span class="linenos">233</span></a>
-</span><span id="UISRNN-234"><a href="#UISRNN-234"><span class="linenos">234</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
-</span><span id="UISRNN-235"><a href="#UISRNN-235"><span class="linenos">235</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
-</span><span id="UISRNN-236"><a href="#UISRNN-236"><span class="linenos">236</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="UISRNN-237"><a href="#UISRNN-237"><span class="linenos">237</span></a>
-</span><span id="UISRNN-238"><a href="#UISRNN-238"><span class="linenos">238</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
-</span><span id="UISRNN-239"><a href="#UISRNN-239"><span class="linenos">239</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN-240"><a href="#UISRNN-240"><span class="linenos">240</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
-</span><span id="UISRNN-241"><a href="#UISRNN-241"><span class="linenos">241</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
-</span><span id="UISRNN-242"><a href="#UISRNN-242"><span class="linenos">242</span></a>
-</span><span id="UISRNN-243"><a href="#UISRNN-243"><span class="linenos">243</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
-</span><span id="UISRNN-244"><a href="#UISRNN-244"><span class="linenos">244</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN-245"><a href="#UISRNN-245"><span class="linenos">245</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN-246"><a href="#UISRNN-246"><span class="linenos">246</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN-247"><a href="#UISRNN-247"><span class="linenos">247</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN-248"><a href="#UISRNN-248"><span class="linenos">248</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN-249"><a href="#UISRNN-249"><span class="linenos">249</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN-250"><a href="#UISRNN-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-251"><a href="#UISRNN-251"><span class="linenos">251</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN-252"><a href="#UISRNN-252"><span class="linenos">252</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
-</span><span id="UISRNN-253"><a href="#UISRNN-253"><span class="linenos">253</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
-</span><span id="UISRNN-254"><a href="#UISRNN-254"><span class="linenos">254</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
-</span><span id="UISRNN-255"><a href="#UISRNN-255"><span class="linenos">255</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN-256"><a href="#UISRNN-256"><span class="linenos">256</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN-257"><a href="#UISRNN-257"><span class="linenos">257</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN-258"><a href="#UISRNN-258"><span class="linenos">258</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN-259"><a href="#UISRNN-259"><span class="linenos">259</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN-260"><a href="#UISRNN-260"><span class="linenos">260</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN-261"><a href="#UISRNN-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-262"><a href="#UISRNN-262"><span class="linenos">262</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="UISRNN-263"><a href="#UISRNN-263"><span class="linenos">263</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="UISRNN-264"><a href="#UISRNN-264"><span class="linenos">264</span></a>      <span class="c1"># use mean to predict</span>
-</span><span id="UISRNN-265"><a href="#UISRNN-265"><span class="linenos">265</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="UISRNN-266"><a href="#UISRNN-266"><span class="linenos">266</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
-</span><span id="UISRNN-267"><a href="#UISRNN-267"><span class="linenos">267</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
-</span><span id="UISRNN-268"><a href="#UISRNN-268"><span class="linenos">268</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
-</span><span id="UISRNN-269"><a href="#UISRNN-269"><span class="linenos">269</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
-</span><span id="UISRNN-270"><a href="#UISRNN-270"><span class="linenos">270</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN-271"><a href="#UISRNN-271"><span class="linenos">271</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
-</span><span id="UISRNN-272"><a href="#UISRNN-272"><span class="linenos">272</span></a>
-</span><span id="UISRNN-273"><a href="#UISRNN-273"><span class="linenos">273</span></a>      <span class="c1"># Likelihood part.</span>
-</span><span id="UISRNN-274"><a href="#UISRNN-274"><span class="linenos">274</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN-275"><a href="#UISRNN-275"><span class="linenos">275</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
-</span><span id="UISRNN-276"><a href="#UISRNN-276"><span class="linenos">276</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
-</span><span id="UISRNN-277"><a href="#UISRNN-277"><span class="linenos">277</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
-</span><span id="UISRNN-278"><a href="#UISRNN-278"><span class="linenos">278</span></a>
-</span><span id="UISRNN-279"><a href="#UISRNN-279"><span class="linenos">279</span></a>      <span class="c1"># Sigma2 prior part.</span>
-</span><span id="UISRNN-280"><a href="#UISRNN-280"><span class="linenos">280</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
-</span><span id="UISRNN-281"><a href="#UISRNN-281"><span class="linenos">281</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="UISRNN-282"><a href="#UISRNN-282"><span class="linenos">282</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
-</span><span id="UISRNN-283"><a href="#UISRNN-283"><span class="linenos">283</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
-</span><span id="UISRNN-284"><a href="#UISRNN-284"><span class="linenos">284</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
-</span><span id="UISRNN-285"><a href="#UISRNN-285"><span class="linenos">285</span></a>
-</span><span id="UISRNN-286"><a href="#UISRNN-286"><span class="linenos">286</span></a>      <span class="c1"># Regularization part.</span>
-</span><span id="UISRNN-287"><a href="#UISRNN-287"><span class="linenos">287</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
-</span><span id="UISRNN-288"><a href="#UISRNN-288"><span class="linenos">288</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
-</span><span id="UISRNN-289"><a href="#UISRNN-289"><span class="linenos">289</span></a>
-</span><span id="UISRNN-290"><a href="#UISRNN-290"><span class="linenos">290</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
-</span><span id="UISRNN-291"><a href="#UISRNN-291"><span class="linenos">291</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
-</span><span id="UISRNN-292"><a href="#UISRNN-292"><span class="linenos">292</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
-</span><span id="UISRNN-293"><a href="#UISRNN-293"><span class="linenos">293</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
-</span><span id="UISRNN-294"><a href="#UISRNN-294"><span class="linenos">294</span></a>      <span class="c1"># avoid numerical issues</span>
-</span><span id="UISRNN-295"><a href="#UISRNN-295"><span class="linenos">295</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
-</span><span id="UISRNN-296"><a href="#UISRNN-296"><span class="linenos">296</span></a>
-</span><span id="UISRNN-297"><a href="#UISRNN-297"><span class="linenos">297</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
-</span><span id="UISRNN-298"><a href="#UISRNN-298"><span class="linenos">298</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="UISRNN-299"><a href="#UISRNN-299"><span class="linenos">299</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-300"><a href="#UISRNN-300"><span class="linenos">300</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN-301"><a href="#UISRNN-301"><span class="linenos">301</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-302"><a href="#UISRNN-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-303"><a href="#UISRNN-303"><span class="linenos">303</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-304"><a href="#UISRNN-304"><span class="linenos">304</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-305"><a href="#UISRNN-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN-306"><a href="#UISRNN-306"><span class="linenos">306</span></a>                <span class="n">num_iter</span><span class="p">,</span>
-</span><span id="UISRNN-307"><a href="#UISRNN-307"><span class="linenos">307</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN-308"><a href="#UISRNN-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN-309"><a href="#UISRNN-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN-310"><a href="#UISRNN-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
-</span><span id="UISRNN-311"><a href="#UISRNN-311"><span class="linenos">311</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
-</span><span id="UISRNN-312"><a href="#UISRNN-312"><span class="linenos">312</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-313"><a href="#UISRNN-313"><span class="linenos">313</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
-</span><span id="UISRNN-314"><a href="#UISRNN-314"><span class="linenos">314</span></a>
-</span><span id="UISRNN-315"><a href="#UISRNN-315"><span class="linenos">315</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-316"><a href="#UISRNN-316"><span class="linenos">316</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
-</span><span id="UISRNN-317"><a href="#UISRNN-317"><span class="linenos">317</span></a>
-</span><span id="UISRNN-318"><a href="#UISRNN-318"><span class="linenos">318</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-319"><a href="#UISRNN-319"><span class="linenos">319</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
-</span><span id="UISRNN-320"><a href="#UISRNN-320"><span class="linenos">320</span></a><span class="sd">        concatenated training sequence:</span>
-</span><span id="UISRNN-321"><a href="#UISRNN-321"><span class="linenos">321</span></a>
-</span><span id="UISRNN-322"><a href="#UISRNN-322"><span class="linenos">322</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
-</span><span id="UISRNN-323"><a href="#UISRNN-323"><span class="linenos">323</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
-</span><span id="UISRNN-324"><a href="#UISRNN-324"><span class="linenos">324</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
-</span><span id="UISRNN-325"><a href="#UISRNN-325"><span class="linenos">325</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
-</span><span id="UISRNN-326"><a href="#UISRNN-326"><span class="linenos">326</span></a><span class="sd">           embeddings of one utterance.</span>
-</span><span id="UISRNN-327"><a href="#UISRNN-327"><span class="linenos">327</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
-</span><span id="UISRNN-328"><a href="#UISRNN-328"><span class="linenos">328</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
-</span><span id="UISRNN-329"><a href="#UISRNN-329"><span class="linenos">329</span></a><span class="sd">           for more details.</span>
-</span><span id="UISRNN-330"><a href="#UISRNN-330"><span class="linenos">330</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
-</span><span id="UISRNN-331"><a href="#UISRNN-331"><span class="linenos">331</span></a>
-</span><span id="UISRNN-332"><a href="#UISRNN-332"><span class="linenos">332</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
-</span><span id="UISRNN-333"><a href="#UISRNN-333"><span class="linenos">333</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
-</span><span id="UISRNN-334"><a href="#UISRNN-334"><span class="linenos">334</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
-</span><span id="UISRNN-335"><a href="#UISRNN-335"><span class="linenos">335</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
-</span><span id="UISRNN-336"><a href="#UISRNN-336"><span class="linenos">336</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-337"><a href="#UISRNN-337"><span class="linenos">337</span></a>
-</span><span id="UISRNN-338"><a href="#UISRNN-338"><span class="linenos">338</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-339"><a href="#UISRNN-339"><span class="linenos">339</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
-</span><span id="UISRNN-340"><a href="#UISRNN-340"><span class="linenos">340</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-341"><a href="#UISRNN-341"><span class="linenos">341</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN-342"><a href="#UISRNN-342"><span class="linenos">342</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
-</span><span id="UISRNN-343"><a href="#UISRNN-343"><span class="linenos">343</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN-344"><a href="#UISRNN-344"><span class="linenos">344</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
-</span><span id="UISRNN-345"><a href="#UISRNN-345"><span class="linenos">345</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-346"><a href="#UISRNN-346"><span class="linenos">346</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN-347"><a href="#UISRNN-347"><span class="linenos">347</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
-</span><span id="UISRNN-348"><a href="#UISRNN-348"><span class="linenos">348</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
-</span><span id="UISRNN-349"><a href="#UISRNN-349"><span class="linenos">349</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
-</span><span id="UISRNN-350"><a href="#UISRNN-350"><span class="linenos">350</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
-</span><span id="UISRNN-351"><a href="#UISRNN-351"><span class="linenos">351</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-352"><a href="#UISRNN-352"><span class="linenos">352</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
-</span><span id="UISRNN-353"><a href="#UISRNN-353"><span class="linenos">353</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
-</span><span id="UISRNN-354"><a href="#UISRNN-354"><span class="linenos">354</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN-355"><a href="#UISRNN-355"><span class="linenos">355</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
-</span><span id="UISRNN-356"><a href="#UISRNN-356"><span class="linenos">356</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
-</span><span id="UISRNN-357"><a href="#UISRNN-357"><span class="linenos">357</span></a>      <span class="k">pass</span>
-</span><span id="UISRNN-358"><a href="#UISRNN-358"><span class="linenos">358</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN-359"><a href="#UISRNN-359"><span class="linenos">359</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-360"><a href="#UISRNN-360"><span class="linenos">360</span></a>
-</span><span id="UISRNN-361"><a href="#UISRNN-361"><span class="linenos">361</span></a>    <span class="c1"># estimate transition_bias</span>
-</span><span id="UISRNN-362"><a href="#UISRNN-362"><span class="linenos">362</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN-363"><a href="#UISRNN-363"><span class="linenos">363</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN-364"><a href="#UISRNN-364"><span class="linenos">364</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
-</span><span id="UISRNN-365"><a href="#UISRNN-365"><span class="linenos">365</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
-</span><span id="UISRNN-366"><a href="#UISRNN-366"><span class="linenos">366</span></a>      <span class="c1"># set or update transition_bias</span>
-</span><span id="UISRNN-367"><a href="#UISRNN-367"><span class="linenos">367</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN-368"><a href="#UISRNN-368"><span class="linenos">368</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
-</span><span id="UISRNN-369"><a href="#UISRNN-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN-370"><a href="#UISRNN-370"><span class="linenos">370</span></a>      <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN-371"><a href="#UISRNN-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="UISRNN-372"><a href="#UISRNN-372"><span class="linenos">372</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
-</span><span id="UISRNN-373"><a href="#UISRNN-373"><span class="linenos">373</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="UISRNN-374"><a href="#UISRNN-374"><span class="linenos">374</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
-</span><span id="UISRNN-375"><a href="#UISRNN-375"><span class="linenos">375</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN-376"><a href="#UISRNN-376"><span class="linenos">376</span></a>
-</span><span id="UISRNN-377"><a href="#UISRNN-377"><span class="linenos">377</span></a>    <span class="c1"># concatenate train_sequences</span>
-</span><span id="UISRNN-378"><a href="#UISRNN-378"><span class="linenos">378</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN-379"><a href="#UISRNN-379"><span class="linenos">379</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
-</span><span id="UISRNN-380"><a href="#UISRNN-380"><span class="linenos">380</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
-</span><span id="UISRNN-381"><a href="#UISRNN-381"><span class="linenos">381</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
-</span><span id="UISRNN-382"><a href="#UISRNN-382"><span class="linenos">382</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
-</span><span id="UISRNN-383"><a href="#UISRNN-383"><span class="linenos">383</span></a>         <span class="kc">True</span><span class="p">)</span>
-</span><span id="UISRNN-384"><a href="#UISRNN-384"><span class="linenos">384</span></a>
-</span><span id="UISRNN-385"><a href="#UISRNN-385"><span class="linenos">385</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
-</span><span id="UISRNN-386"><a href="#UISRNN-386"><span class="linenos">386</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN-387"><a href="#UISRNN-387"><span class="linenos">387</span></a>
-</span><span id="UISRNN-388"><a href="#UISRNN-388"><span class="linenos">388</span></a>  <span class="k">def</span> <span class="nf">_update_beam_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">):</span>
-</span><span id="UISRNN-389"><a href="#UISRNN-389"><span class="linenos">389</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update a beam state given a look ahead sequence and known cluster</span>
-</span><span id="UISRNN-390"><a href="#UISRNN-390"><span class="linenos">390</span></a><span class="sd">    assignments.</span>
-</span><span id="UISRNN-391"><a href="#UISRNN-391"><span class="linenos">391</span></a>
-</span><span id="UISRNN-392"><a href="#UISRNN-392"><span class="linenos">392</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-393"><a href="#UISRNN-393"><span class="linenos">393</span></a><span class="sd">      beam_state: A BeamState object.</span>
-</span><span id="UISRNN-394"><a href="#UISRNN-394"><span class="linenos">394</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
-</span><span id="UISRNN-395"><a href="#UISRNN-395"><span class="linenos">395</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
-</span><span id="UISRNN-396"><a href="#UISRNN-396"><span class="linenos">396</span></a><span class="sd">        D: observation dimension</span>
-</span><span id="UISRNN-397"><a href="#UISRNN-397"><span class="linenos">397</span></a><span class="sd">      cluster_seq: Cluster assignment sequence for look_ahead_seq.</span>
-</span><span id="UISRNN-398"><a href="#UISRNN-398"><span class="linenos">398</span></a>
-</span><span id="UISRNN-399"><a href="#UISRNN-399"><span class="linenos">399</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-400"><a href="#UISRNN-400"><span class="linenos">400</span></a><span class="sd">      new_beam_state: An updated BeamState object.</span>
-</span><span id="UISRNN-401"><a href="#UISRNN-401"><span class="linenos">401</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-402"><a href="#UISRNN-402"><span class="linenos">402</span></a>
-</span><span id="UISRNN-403"><a href="#UISRNN-403"><span class="linenos">403</span></a>    <span class="n">loss</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="UISRNN-404"><a href="#UISRNN-404"><span class="linenos">404</span></a>    <span class="n">new_beam_state</span> <span class="o">=</span> <span class="n">BeamState</span><span class="p">(</span><span class="n">beam_state</span><span class="p">)</span>
-</span><span id="UISRNN-405"><a href="#UISRNN-405"><span class="linenos">405</span></a>    <span class="k">for</span> <span class="n">sub_idx</span><span class="p">,</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster_seq</span><span class="p">):</span>
-</span><span id="UISRNN-406"><a href="#UISRNN-406"><span class="linenos">406</span></a>      <span class="k">if</span> <span class="n">cluster</span> <span class="o">&gt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># invalid trace</span>
-</span><span id="UISRNN-407"><a href="#UISRNN-407"><span class="linenos">407</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-408"><a href="#UISRNN-408"><span class="linenos">408</span></a>        <span class="k">break</span>
-</span><span id="UISRNN-409"><a href="#UISRNN-409"><span class="linenos">409</span></a>      <span class="k">elif</span> <span class="n">cluster</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># existing cluster</span>
-</span><span id="UISRNN-410"><a href="#UISRNN-410"><span class="linenos">410</span></a>        <span class="n">last_cluster</span> <span class="o">=</span> <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="UISRNN-411"><a href="#UISRNN-411"><span class="linenos">411</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN-412"><a href="#UISRNN-412"><span class="linenos">412</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]),</span>
-</span><span id="UISRNN-413"><a href="#UISRNN-413"><span class="linenos">413</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
-</span><span id="UISRNN-414"><a href="#UISRNN-414"><span class="linenos">414</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
-</span><span id="UISRNN-415"><a href="#UISRNN-415"><span class="linenos">415</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">==</span> <span class="n">last_cluster</span><span class="p">:</span>
-</span><span id="UISRNN-416"><a href="#UISRNN-416"><span class="linenos">416</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span>
-</span><span id="UISRNN-417"><a href="#UISRNN-417"><span class="linenos">417</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN-418"><a href="#UISRNN-418"><span class="linenos">418</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-419"><a href="#UISRNN-419"><span class="linenos">419</span></a>              <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-420"><a href="#UISRNN-420"><span class="linenos">420</span></a>                  <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
-</span><span id="UISRNN-421"><a href="#UISRNN-421"><span class="linenos">421</span></a>        <span class="c1"># update new mean and new hidden</span>
-</span><span id="UISRNN-422"><a href="#UISRNN-422"><span class="linenos">422</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
-</span><span id="UISRNN-423"><a href="#UISRNN-423"><span class="linenos">423</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
-</span><span id="UISRNN-424"><a href="#UISRNN-424"><span class="linenos">424</span></a>            <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span>
-</span><span id="UISRNN-425"><a href="#UISRNN-425"><span class="linenos">425</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span><span class="o">*</span><span class="p">(</span>
-</span><span id="UISRNN-426"><a href="#UISRNN-426"><span class="linenos">426</span></a>            <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span> <span class="o">-</span>
-</span><span id="UISRNN-427"><a href="#UISRNN-427"><span class="linenos">427</span></a>            <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span> <span class="o">+</span> <span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="UISRNN-428"><a href="#UISRNN-428"><span class="linenos">428</span></a>                <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span>
-</span><span id="UISRNN-429"><a href="#UISRNN-429"><span class="linenos">429</span></a>                    <span class="nb">float</span><span class="p">)</span>  <span class="c1"># use mean to predict</span>
-</span><span id="UISRNN-430"><a href="#UISRNN-430"><span class="linenos">430</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
-</span><span id="UISRNN-431"><a href="#UISRNN-431"><span class="linenos">431</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">!=</span> <span class="n">last_cluster</span><span class="p">:</span>
-</span><span id="UISRNN-432"><a href="#UISRNN-432"><span class="linenos">432</span></a>          <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="UISRNN-433"><a href="#UISRNN-433"><span class="linenos">433</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
-</span><span id="UISRNN-434"><a href="#UISRNN-434"><span class="linenos">434</span></a>      <span class="k">else</span><span class="p">:</span>  <span class="c1"># new cluster</span>
-</span><span id="UISRNN-435"><a href="#UISRNN-435"><span class="linenos">435</span></a>        <span class="n">init_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="UISRNN-436"><a href="#UISRNN-436"><span class="linenos">436</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="UISRNN-437"><a href="#UISRNN-437"><span class="linenos">437</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-438"><a href="#UISRNN-438"><span class="linenos">438</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">init_input</span><span class="p">,</span>
-</span><span id="UISRNN-439"><a href="#UISRNN-439"><span class="linenos">439</span></a>                                      <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="p">)</span>
-</span><span id="UISRNN-440"><a href="#UISRNN-440"><span class="linenos">440</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN-441"><a href="#UISRNN-441"><span class="linenos">441</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">mean</span><span class="p">),</span>
-</span><span id="UISRNN-442"><a href="#UISRNN-442"><span class="linenos">442</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
-</span><span id="UISRNN-443"><a href="#UISRNN-443"><span class="linenos">443</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
-</span><span id="UISRNN-444"><a href="#UISRNN-444"><span class="linenos">444</span></a>        <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-445"><a href="#UISRNN-445"><span class="linenos">445</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-446"><a href="#UISRNN-446"><span class="linenos">446</span></a>                <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
-</span><span id="UISRNN-447"><a href="#UISRNN-447"><span class="linenos">447</span></a>        <span class="c1"># update new min and new hidden</span>
-</span><span id="UISRNN-448"><a href="#UISRNN-448"><span class="linenos">448</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
-</span><span id="UISRNN-449"><a href="#UISRNN-449"><span class="linenos">449</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
-</span><span id="UISRNN-450"><a href="#UISRNN-450"><span class="linenos">450</span></a>            <span class="n">hidden</span><span class="p">)</span>
-</span><span id="UISRNN-451"><a href="#UISRNN-451"><span class="linenos">451</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">)</span>
-</span><span id="UISRNN-452"><a href="#UISRNN-452"><span class="linenos">452</span></a>      <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">+=</span> <span class="n">loss</span>
-</span><span id="UISRNN-453"><a href="#UISRNN-453"><span class="linenos">453</span></a>    <span class="k">return</span> <span class="n">new_beam_state</span>
-</span><span id="UISRNN-454"><a href="#UISRNN-454"><span class="linenos">454</span></a>
-</span><span id="UISRNN-455"><a href="#UISRNN-455"><span class="linenos">455</span></a>  <span class="k">def</span> <span class="nf">_calculate_score</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">):</span>
-</span><span id="UISRNN-456"><a href="#UISRNN-456"><span class="linenos">456</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Calculate negative log likelihoods for all possible state allocations</span>
-</span><span id="UISRNN-457"><a href="#UISRNN-457"><span class="linenos">457</span></a><span class="sd">       of a look ahead sequence, according to the current beam state.</span>
-</span><span id="UISRNN-458"><a href="#UISRNN-458"><span class="linenos">458</span></a>
-</span><span id="UISRNN-459"><a href="#UISRNN-459"><span class="linenos">459</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-460"><a href="#UISRNN-460"><span class="linenos">460</span></a><span class="sd">      beam_state: A BeamState object.</span>
-</span><span id="UISRNN-461"><a href="#UISRNN-461"><span class="linenos">461</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
-</span><span id="UISRNN-462"><a href="#UISRNN-462"><span class="linenos">462</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
-</span><span id="UISRNN-463"><a href="#UISRNN-463"><span class="linenos">463</span></a><span class="sd">        D: observation dimension</span>
-</span><span id="UISRNN-464"><a href="#UISRNN-464"><span class="linenos">464</span></a>
-</span><span id="UISRNN-465"><a href="#UISRNN-465"><span class="linenos">465</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-466"><a href="#UISRNN-466"><span class="linenos">466</span></a><span class="sd">      beam_score_set: a set of scores for each possible state allocation.</span>
-</span><span id="UISRNN-467"><a href="#UISRNN-467"><span class="linenos">467</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-468"><a href="#UISRNN-468"><span class="linenos">468</span></a>
-</span><span id="UISRNN-469"><a href="#UISRNN-469"><span class="linenos">469</span></a>    <span class="n">look_ahead</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN-470"><a href="#UISRNN-470"><span class="linenos">470</span></a>    <span class="n">beam_num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span>
-</span><span id="UISRNN-471"><a href="#UISRNN-471"><span class="linenos">471</span></a>    <span class="n">beam_score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="UISRNN-472"><a href="#UISRNN-472"><span class="linenos">472</span></a>        <span class="n">beam_num_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">look_ahead</span><span class="p">))</span>
-</span><span id="UISRNN-473"><a href="#UISRNN-473"><span class="linenos">473</span></a>    <span class="k">for</span> <span class="n">cluster_seq</span><span class="p">,</span> <span class="n">_</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">ndenumerate</span><span class="p">(</span><span class="n">beam_score_set</span><span class="p">):</span>
-</span><span id="UISRNN-474"><a href="#UISRNN-474"><span class="linenos">474</span></a>      <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span>
-</span><span id="UISRNN-475"><a href="#UISRNN-475"><span class="linenos">475</span></a>                                                   <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="UISRNN-476"><a href="#UISRNN-476"><span class="linenos">476</span></a>      <span class="n">beam_score_set</span><span class="p">[</span><span class="n">cluster_seq</span><span class="p">]</span> <span class="o">=</span> <span class="n">updated_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span>
-</span><span id="UISRNN-477"><a href="#UISRNN-477"><span class="linenos">477</span></a>    <span class="k">return</span> <span class="n">beam_score_set</span>
-</span><span id="UISRNN-478"><a href="#UISRNN-478"><span class="linenos">478</span></a>
-</span><span id="UISRNN-479"><a href="#UISRNN-479"><span class="linenos">479</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-480"><a href="#UISRNN-480"><span class="linenos">480</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
-</span><span id="UISRNN-481"><a href="#UISRNN-481"><span class="linenos">481</span></a>
-</span><span id="UISRNN-482"><a href="#UISRNN-482"><span class="linenos">482</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-483"><a href="#UISRNN-483"><span class="linenos">483</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
-</span><span id="UISRNN-484"><a href="#UISRNN-484"><span class="linenos">484</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN-485"><a href="#UISRNN-485"><span class="linenos">485</span></a>
-</span><span id="UISRNN-486"><a href="#UISRNN-486"><span class="linenos">486</span></a><span class="sd">        - `N`: length of one test utterance.</span>
-</span><span id="UISRNN-487"><a href="#UISRNN-487"><span class="linenos">487</span></a><span class="sd">        - `D` : observation dimension.</span>
-</span><span id="UISRNN-488"><a href="#UISRNN-488"><span class="linenos">488</span></a>
-</span><span id="UISRNN-489"><a href="#UISRNN-489"><span class="linenos">489</span></a><span class="sd">        For example:</span>
-</span><span id="UISRNN-490"><a href="#UISRNN-490"><span class="linenos">490</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-491"><a href="#UISRNN-491"><span class="linenos">491</span></a><span class="sd">      test_sequence =</span>
-</span><span id="UISRNN-492"><a href="#UISRNN-492"><span class="linenos">492</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-493"><a href="#UISRNN-493"><span class="linenos">493</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-494"><a href="#UISRNN-494"><span class="linenos">494</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-495"><a href="#UISRNN-495"><span class="linenos">495</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-496"><a href="#UISRNN-496"><span class="linenos">496</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-497"><a href="#UISRNN-497"><span class="linenos">497</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-498"><a href="#UISRNN-498"><span class="linenos">498</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN-499"><a href="#UISRNN-499"><span class="linenos">499</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-500"><a href="#UISRNN-500"><span class="linenos">500</span></a>
-</span><span id="UISRNN-501"><a href="#UISRNN-501"><span class="linenos">501</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-502"><a href="#UISRNN-502"><span class="linenos">502</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
-</span><span id="UISRNN-503"><a href="#UISRNN-503"><span class="linenos">503</span></a><span class="sd">        an array of integers, of size `N`.</span>
-</span><span id="UISRNN-504"><a href="#UISRNN-504"><span class="linenos">504</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
-</span><span id="UISRNN-505"><a href="#UISRNN-505"><span class="linenos">505</span></a>
-</span><span id="UISRNN-506"><a href="#UISRNN-506"><span class="linenos">506</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-507"><a href="#UISRNN-507"><span class="linenos">507</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
-</span><span id="UISRNN-508"><a href="#UISRNN-508"><span class="linenos">508</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
-</span><span id="UISRNN-509"><a href="#UISRNN-509"><span class="linenos">509</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-510"><a href="#UISRNN-510"><span class="linenos">510</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN-511"><a href="#UISRNN-511"><span class="linenos">511</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN-512"><a href="#UISRNN-512"><span class="linenos">512</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN-513"><a href="#UISRNN-513"><span class="linenos">513</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-514"><a href="#UISRNN-514"><span class="linenos">514</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN-515"><a href="#UISRNN-515"><span class="linenos">515</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN-516"><a href="#UISRNN-516"><span class="linenos">516</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-517"><a href="#UISRNN-517"><span class="linenos">517</span></a>    <span class="c1"># check size</span>
-</span><span id="UISRNN-518"><a href="#UISRNN-518"><span class="linenos">518</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN-519"><a href="#UISRNN-519"><span class="linenos">519</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN-520"><a href="#UISRNN-520"><span class="linenos">520</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN-521"><a href="#UISRNN-521"><span class="linenos">521</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-522"><a href="#UISRNN-522"><span class="linenos">522</span></a>
-</span><span id="UISRNN-523"><a href="#UISRNN-523"><span class="linenos">523</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-</span><span id="UISRNN-524"><a href="#UISRNN-524"><span class="linenos">524</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN-525"><a href="#UISRNN-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="UISRNN-526"><a href="#UISRNN-526"><span class="linenos">526</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-527"><a href="#UISRNN-527"><span class="linenos">527</span></a>    <span class="c1"># bookkeeping for beam search</span>
-</span><span id="UISRNN-528"><a href="#UISRNN-528"><span class="linenos">528</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
-</span><span id="UISRNN-529"><a href="#UISRNN-529"><span class="linenos">529</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
-</span><span id="UISRNN-530"><a href="#UISRNN-530"><span class="linenos">530</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
-</span><span id="UISRNN-531"><a href="#UISRNN-531"><span class="linenos">531</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
-</span><span id="UISRNN-532"><a href="#UISRNN-532"><span class="linenos">532</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
-</span><span id="UISRNN-533"><a href="#UISRNN-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="UISRNN-534"><a href="#UISRNN-534"><span class="linenos">534</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="UISRNN-535"><a href="#UISRNN-535"><span class="linenos">535</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="UISRNN-536"><a href="#UISRNN-536"><span class="linenos">536</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-</span><span id="UISRNN-537"><a href="#UISRNN-537"><span class="linenos">537</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
-</span><span id="UISRNN-538"><a href="#UISRNN-538"><span class="linenos">538</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
-</span><span id="UISRNN-539"><a href="#UISRNN-539"><span class="linenos">539</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
-</span><span id="UISRNN-540"><a href="#UISRNN-540"><span class="linenos">540</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-</span><span id="UISRNN-541"><a href="#UISRNN-541"><span class="linenos">541</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
-</span><span id="UISRNN-542"><a href="#UISRNN-542"><span class="linenos">542</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
-</span><span id="UISRNN-543"><a href="#UISRNN-543"><span class="linenos">543</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
-</span><span id="UISRNN-544"><a href="#UISRNN-544"><span class="linenos">544</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
-</span><span id="UISRNN-545"><a href="#UISRNN-545"><span class="linenos">545</span></a>      <span class="c1"># find top scores</span>
-</span><span id="UISRNN-546"><a href="#UISRNN-546"><span class="linenos">546</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-547"><a href="#UISRNN-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="UISRNN-548"><a href="#UISRNN-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
-</span><span id="UISRNN-549"><a href="#UISRNN-549"><span class="linenos">549</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-550"><a href="#UISRNN-550"><span class="linenos">550</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN-551"><a href="#UISRNN-551"><span class="linenos">551</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
-</span><span id="UISRNN-552"><a href="#UISRNN-552"><span class="linenos">552</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
-</span><span id="UISRNN-553"><a href="#UISRNN-553"><span class="linenos">553</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
-</span><span id="UISRNN-554"><a href="#UISRNN-554"><span class="linenos">554</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
-</span><span id="UISRNN-555"><a href="#UISRNN-555"><span class="linenos">555</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
-</span><span id="UISRNN-556"><a href="#UISRNN-556"><span class="linenos">556</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="UISRNN-557"><a href="#UISRNN-557"><span class="linenos">557</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
-</span><span id="UISRNN-558"><a href="#UISRNN-558"><span class="linenos">558</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="UISRNN-559"><a href="#UISRNN-559"><span class="linenos">559</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
-</span><span id="UISRNN-560"><a href="#UISRNN-560"><span class="linenos">560</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
-</span><span id="UISRNN-561"><a href="#UISRNN-561"><span class="linenos">561</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
-</span><span id="UISRNN-562"><a href="#UISRNN-562"><span class="linenos">562</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
-</span><span id="UISRNN-563"><a href="#UISRNN-563"><span class="linenos">563</span></a>
-</span><span id="UISRNN-564"><a href="#UISRNN-564"><span class="linenos">564</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-565"><a href="#UISRNN-565"><span class="linenos">565</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
-</span><span id="UISRNN-566"><a href="#UISRNN-566"><span class="linenos">566</span></a>
-</span><span id="UISRNN-567"><a href="#UISRNN-567"><span class="linenos">567</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-568"><a href="#UISRNN-568"><span class="linenos">568</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
-</span><span id="UISRNN-569"><a href="#UISRNN-569"><span class="linenos">569</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="UISRNN-570"><a href="#UISRNN-570"><span class="linenos">570</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
-</span><span id="UISRNN-571"><a href="#UISRNN-571"><span class="linenos">571</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-572"><a href="#UISRNN-572"><span class="linenos">572</span></a>
-</span><span id="UISRNN-573"><a href="#UISRNN-573"><span class="linenos">573</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-574"><a href="#UISRNN-574"><span class="linenos">574</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
-</span><span id="UISRNN-575"><a href="#UISRNN-575"><span class="linenos">575</span></a>
-</span><span id="UISRNN-576"><a href="#UISRNN-576"><span class="linenos">576</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
-</span><span id="UISRNN-577"><a href="#UISRNN-577"><span class="linenos">577</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
-</span><span id="UISRNN-578"><a href="#UISRNN-578"><span class="linenos">578</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
-</span><span id="UISRNN-579"><a href="#UISRNN-579"><span class="linenos">579</span></a><span class="sd">           be a 1-dim list of strings</span>
-</span><span id="UISRNN-580"><a href="#UISRNN-580"><span class="linenos">580</span></a>
-</span><span id="UISRNN-581"><a href="#UISRNN-581"><span class="linenos">581</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-582"><a href="#UISRNN-582"><span class="linenos">582</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="UISRNN-583"><a href="#UISRNN-583"><span class="linenos">583</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-584"><a href="#UISRNN-584"><span class="linenos">584</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN-585"><a href="#UISRNN-585"><span class="linenos">585</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN-586"><a href="#UISRNN-586"><span class="linenos">586</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN-587"><a href="#UISRNN-587"><span class="linenos">587</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN-588"><a href="#UISRNN-588"><span class="linenos">588</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN-589"><a href="#UISRNN-589"><span class="linenos">589</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
-</span><span id="UISRNN-590"><a href="#UISRNN-590"><span class="linenos">590</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN-81"><a href="#UISRNN-81"><span class="linenos"> 81</span></a><span class="k">class</span> <span class="nc">UISRNN</span><span class="p">:</span>
+</span><span id="UISRNN-82"><a href="#UISRNN-82"><span class="linenos"> 82</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Unbounded Interleaved-State Recurrent Neural Networks.&quot;&quot;&quot;</span>
+</span><span id="UISRNN-83"><a href="#UISRNN-83"><span class="linenos"> 83</span></a>
+</span><span id="UISRNN-84"><a href="#UISRNN-84"><span class="linenos"> 84</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-85"><a href="#UISRNN-85"><span class="linenos"> 85</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
+</span><span id="UISRNN-86"><a href="#UISRNN-86"><span class="linenos"> 86</span></a>
+</span><span id="UISRNN-87"><a href="#UISRNN-87"><span class="linenos"> 87</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-88"><a href="#UISRNN-88"><span class="linenos"> 88</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-89"><a href="#UISRNN-89"><span class="linenos"> 89</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-90"><a href="#UISRNN-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
+</span><span id="UISRNN-91"><a href="#UISRNN-91"><span class="linenos"> 91</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
+</span><span id="UISRNN-92"><a href="#UISRNN-92"><span class="linenos"> 92</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-93"><a href="#UISRNN-93"><span class="linenos"> 93</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="UISRNN-94"><a href="#UISRNN-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN-95"><a href="#UISRNN-95"><span class="linenos"> 95</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-96"><a href="#UISRNN-96"><span class="linenos"> 96</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-97"><a href="#UISRNN-97"><span class="linenos"> 97</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-98"><a href="#UISRNN-98"><span class="linenos"> 98</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
+</span><span id="UISRNN-99"><a href="#UISRNN-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-100"><a href="#UISRNN-100"><span class="linenos">100</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-101"><a href="#UISRNN-101"><span class="linenos">101</span></a>    <span class="c1"># initial values of variables</span>
+</span><span id="UISRNN-102"><a href="#UISRNN-102"><span class="linenos">102</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="UISRNN-103"><a href="#UISRNN-103"><span class="linenos">103</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-104"><a href="#UISRNN-104"><span class="linenos">104</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-105"><a href="#UISRNN-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
+</span><span id="UISRNN-106"><a href="#UISRNN-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="UISRNN-107"><a href="#UISRNN-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
+</span><span id="UISRNN-108"><a href="#UISRNN-108"><span class="linenos">108</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">colortimelog</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
+</span><span id="UISRNN-109"><a href="#UISRNN-109"><span class="linenos">109</span></a>
+</span><span id="UISRNN-110"><a href="#UISRNN-110"><span class="linenos">110</span></a>  <span class="k">def</span> <span class="nf">_get_optimizer</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">optimizer</span><span class="p">,</span> <span class="n">learning_rate</span><span class="p">):</span>
+</span><span id="UISRNN-111"><a href="#UISRNN-111"><span class="linenos">111</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Get optimizer for UISRNN.</span>
+</span><span id="UISRNN-112"><a href="#UISRNN-112"><span class="linenos">112</span></a>
+</span><span id="UISRNN-113"><a href="#UISRNN-113"><span class="linenos">113</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-114"><a href="#UISRNN-114"><span class="linenos">114</span></a><span class="sd">      optimizer: string - name of the optimizer.</span>
+</span><span id="UISRNN-115"><a href="#UISRNN-115"><span class="linenos">115</span></a><span class="sd">      learning_rate: - learning rate for the entire model.</span>
+</span><span id="UISRNN-116"><a href="#UISRNN-116"><span class="linenos">116</span></a><span class="sd">        We do not customize learning rate for separate parts.</span>
+</span><span id="UISRNN-117"><a href="#UISRNN-117"><span class="linenos">117</span></a>
+</span><span id="UISRNN-118"><a href="#UISRNN-118"><span class="linenos">118</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-119"><a href="#UISRNN-119"><span class="linenos">119</span></a><span class="sd">      a pytorch &quot;optim&quot; object</span>
+</span><span id="UISRNN-120"><a href="#UISRNN-120"><span class="linenos">120</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-121"><a href="#UISRNN-121"><span class="linenos">121</span></a>    <span class="n">params</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="UISRNN-122"><a href="#UISRNN-122"><span class="linenos">122</span></a>        <span class="p">{</span>
+</span><span id="UISRNN-123"><a href="#UISRNN-123"><span class="linenos">123</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
+</span><span id="UISRNN-124"><a href="#UISRNN-124"><span class="linenos">124</span></a>        <span class="p">},</span>  <span class="c1"># rnn parameters</span>
+</span><span id="UISRNN-125"><a href="#UISRNN-125"><span class="linenos">125</span></a>        <span class="p">{</span>
+</span><span id="UISRNN-126"><a href="#UISRNN-126"><span class="linenos">126</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span>
+</span><span id="UISRNN-127"><a href="#UISRNN-127"><span class="linenos">127</span></a>        <span class="p">}</span>  <span class="c1"># rnn initial hidden state</span>
+</span><span id="UISRNN-128"><a href="#UISRNN-128"><span class="linenos">128</span></a>    <span class="p">]</span>
+</span><span id="UISRNN-129"><a href="#UISRNN-129"><span class="linenos">129</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span><span class="p">:</span>  <span class="c1"># train sigma2</span>
+</span><span id="UISRNN-130"><a href="#UISRNN-130"><span class="linenos">130</span></a>      <span class="n">params</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="UISRNN-131"><a href="#UISRNN-131"><span class="linenos">131</span></a>          <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="UISRNN-132"><a href="#UISRNN-132"><span class="linenos">132</span></a>      <span class="p">})</span>  <span class="c1"># variance parameters</span>
+</span><span id="UISRNN-133"><a href="#UISRNN-133"><span class="linenos">133</span></a>    <span class="k">assert</span> <span class="n">optimizer</span> <span class="o">==</span> <span class="s1">&#39;adam&#39;</span><span class="p">,</span> <span class="s1">&#39;Only adam optimizer is supported.&#39;</span>
+</span><span id="UISRNN-134"><a href="#UISRNN-134"><span class="linenos">134</span></a>    <span class="k">return</span> <span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="UISRNN-135"><a href="#UISRNN-135"><span class="linenos">135</span></a>
+</span><span id="UISRNN-136"><a href="#UISRNN-136"><span class="linenos">136</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN-137"><a href="#UISRNN-137"><span class="linenos">137</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
+</span><span id="UISRNN-138"><a href="#UISRNN-138"><span class="linenos">138</span></a>
+</span><span id="UISRNN-139"><a href="#UISRNN-139"><span class="linenos">139</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-140"><a href="#UISRNN-140"><span class="linenos">140</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN-141"><a href="#UISRNN-141"><span class="linenos">141</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-142"><a href="#UISRNN-142"><span class="linenos">142</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
+</span><span id="UISRNN-143"><a href="#UISRNN-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
+</span><span id="UISRNN-144"><a href="#UISRNN-144"><span class="linenos">144</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
+</span><span id="UISRNN-145"><a href="#UISRNN-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN-146"><a href="#UISRNN-146"><span class="linenos">146</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
+</span><span id="UISRNN-147"><a href="#UISRNN-147"><span class="linenos">147</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="UISRNN-148"><a href="#UISRNN-148"><span class="linenos">148</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
+</span><span id="UISRNN-149"><a href="#UISRNN-149"><span class="linenos">149</span></a>
+</span><span id="UISRNN-150"><a href="#UISRNN-150"><span class="linenos">150</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN-151"><a href="#UISRNN-151"><span class="linenos">151</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
+</span><span id="UISRNN-152"><a href="#UISRNN-152"><span class="linenos">152</span></a>
+</span><span id="UISRNN-153"><a href="#UISRNN-153"><span class="linenos">153</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-154"><a href="#UISRNN-154"><span class="linenos">154</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN-155"><a href="#UISRNN-155"><span class="linenos">155</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-156"><a href="#UISRNN-156"><span class="linenos">156</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
+</span><span id="UISRNN-157"><a href="#UISRNN-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-158"><a href="#UISRNN-158"><span class="linenos">158</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-159"><a href="#UISRNN-159"><span class="linenos">159</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-160"><a href="#UISRNN-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-161"><a href="#UISRNN-161"><span class="linenos">161</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
+</span><span id="UISRNN-162"><a href="#UISRNN-162"><span class="linenos">162</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-163"><a href="#UISRNN-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-164"><a href="#UISRNN-164"><span class="linenos">164</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-165"><a href="#UISRNN-165"><span class="linenos">165</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-166"><a href="#UISRNN-166"><span class="linenos">166</span></a>
+</span><span id="UISRNN-167"><a href="#UISRNN-167"><span class="linenos">167</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-168"><a href="#UISRNN-168"><span class="linenos">168</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
+</span><span id="UISRNN-169"><a href="#UISRNN-169"><span class="linenos">169</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN-170"><a href="#UISRNN-170"><span class="linenos">170</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
+</span><span id="UISRNN-171"><a href="#UISRNN-171"><span class="linenos">171</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
+</span><span id="UISRNN-172"><a href="#UISRNN-172"><span class="linenos">172</span></a>
+</span><span id="UISRNN-173"><a href="#UISRNN-173"><span class="linenos">173</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-174"><a href="#UISRNN-174"><span class="linenos">174</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
+</span><span id="UISRNN-175"><a href="#UISRNN-175"><span class="linenos">175</span></a>
+</span><span id="UISRNN-176"><a href="#UISRNN-176"><span class="linenos">176</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-177"><a href="#UISRNN-177"><span class="linenos">177</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
+</span><span id="UISRNN-178"><a href="#UISRNN-178"><span class="linenos">178</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN-179"><a href="#UISRNN-179"><span class="linenos">179</span></a>
+</span><span id="UISRNN-180"><a href="#UISRNN-180"><span class="linenos">180</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
+</span><span id="UISRNN-181"><a href="#UISRNN-181"><span class="linenos">181</span></a><span class="sd">        - `D`: observation dimension.</span>
+</span><span id="UISRNN-182"><a href="#UISRNN-182"><span class="linenos">182</span></a>
+</span><span id="UISRNN-183"><a href="#UISRNN-183"><span class="linenos">183</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN-184"><a href="#UISRNN-184"><span class="linenos">184</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-185"><a href="#UISRNN-185"><span class="linenos">185</span></a><span class="sd">      train_sequence =</span>
+</span><span id="UISRNN-186"><a href="#UISRNN-186"><span class="linenos">186</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN-187"><a href="#UISRNN-187"><span class="linenos">187</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN-188"><a href="#UISRNN-188"><span class="linenos">188</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN-189"><a href="#UISRNN-189"><span class="linenos">189</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN-190"><a href="#UISRNN-190"><span class="linenos">190</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN-191"><a href="#UISRNN-191"><span class="linenos">191</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-192"><a href="#UISRNN-192"><span class="linenos">192</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN-193"><a href="#UISRNN-193"><span class="linenos">193</span></a>
+</span><span id="UISRNN-194"><a href="#UISRNN-194"><span class="linenos">194</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
+</span><span id="UISRNN-195"><a href="#UISRNN-195"><span class="linenos">195</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
+</span><span id="UISRNN-196"><a href="#UISRNN-196"><span class="linenos">196</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
+</span><span id="UISRNN-197"><a href="#UISRNN-197"><span class="linenos">197</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN-198"><a href="#UISRNN-198"><span class="linenos">198</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-199"><a href="#UISRNN-199"><span class="linenos">199</span></a><span class="sd">      train_cluster_id =</span>
+</span><span id="UISRNN-200"><a href="#UISRNN-200"><span class="linenos">200</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
+</span><span id="UISRNN-201"><a href="#UISRNN-201"><span class="linenos">201</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-202"><a href="#UISRNN-202"><span class="linenos">202</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
+</span><span id="UISRNN-203"><a href="#UISRNN-203"><span class="linenos">203</span></a>
+</span><span id="UISRNN-204"><a href="#UISRNN-204"><span class="linenos">204</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
+</span><span id="UISRNN-205"><a href="#UISRNN-205"><span class="linenos">205</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
+</span><span id="UISRNN-206"><a href="#UISRNN-206"><span class="linenos">206</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-207"><a href="#UISRNN-207"><span class="linenos">207</span></a>
+</span><span id="UISRNN-208"><a href="#UISRNN-208"><span class="linenos">208</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-209"><a href="#UISRNN-209"><span class="linenos">209</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
+</span><span id="UISRNN-210"><a href="#UISRNN-210"><span class="linenos">210</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
+</span><span id="UISRNN-211"><a href="#UISRNN-211"><span class="linenos">211</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-212"><a href="#UISRNN-212"><span class="linenos">212</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN-213"><a href="#UISRNN-213"><span class="linenos">213</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN-214"><a href="#UISRNN-214"><span class="linenos">214</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN-215"><a href="#UISRNN-215"><span class="linenos">215</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-216"><a href="#UISRNN-216"><span class="linenos">216</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN-217"><a href="#UISRNN-217"><span class="linenos">217</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
+</span><span id="UISRNN-218"><a href="#UISRNN-218"><span class="linenos">218</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN-219"><a href="#UISRNN-219"><span class="linenos">219</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
+</span><span id="UISRNN-220"><a href="#UISRNN-220"><span class="linenos">220</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-221"><a href="#UISRNN-221"><span class="linenos">221</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN-222"><a href="#UISRNN-222"><span class="linenos">222</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN-223"><a href="#UISRNN-223"><span class="linenos">223</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-224"><a href="#UISRNN-224"><span class="linenos">224</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="UISRNN-225"><a href="#UISRNN-225"><span class="linenos">225</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-226"><a href="#UISRNN-226"><span class="linenos">226</span></a>    <span class="c1"># check length and size</span>
+</span><span id="UISRNN-227"><a href="#UISRNN-227"><span class="linenos">227</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN-228"><a href="#UISRNN-228"><span class="linenos">228</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN-229"><a href="#UISRNN-229"><span class="linenos">229</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN-230"><a href="#UISRNN-230"><span class="linenos">230</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-231"><a href="#UISRNN-231"><span class="linenos">231</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
+</span><span id="UISRNN-232"><a href="#UISRNN-232"><span class="linenos">232</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
+</span><span id="UISRNN-233"><a href="#UISRNN-233"><span class="linenos">233</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-234"><a href="#UISRNN-234"><span class="linenos">234</span></a>
+</span><span id="UISRNN-235"><a href="#UISRNN-235"><span class="linenos">235</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
+</span><span id="UISRNN-236"><a href="#UISRNN-236"><span class="linenos">236</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
+</span><span id="UISRNN-237"><a href="#UISRNN-237"><span class="linenos">237</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="UISRNN-238"><a href="#UISRNN-238"><span class="linenos">238</span></a>
+</span><span id="UISRNN-239"><a href="#UISRNN-239"><span class="linenos">239</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
+</span><span id="UISRNN-240"><a href="#UISRNN-240"><span class="linenos">240</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN-241"><a href="#UISRNN-241"><span class="linenos">241</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
+</span><span id="UISRNN-242"><a href="#UISRNN-242"><span class="linenos">242</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
+</span><span id="UISRNN-243"><a href="#UISRNN-243"><span class="linenos">243</span></a>
+</span><span id="UISRNN-244"><a href="#UISRNN-244"><span class="linenos">244</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
+</span><span id="UISRNN-245"><a href="#UISRNN-245"><span class="linenos">245</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN-246"><a href="#UISRNN-246"><span class="linenos">246</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN-247"><a href="#UISRNN-247"><span class="linenos">247</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN-248"><a href="#UISRNN-248"><span class="linenos">248</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN-249"><a href="#UISRNN-249"><span class="linenos">249</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN-250"><a href="#UISRNN-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN-251"><a href="#UISRNN-251"><span class="linenos">251</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-252"><a href="#UISRNN-252"><span class="linenos">252</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN-253"><a href="#UISRNN-253"><span class="linenos">253</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
+</span><span id="UISRNN-254"><a href="#UISRNN-254"><span class="linenos">254</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
+</span><span id="UISRNN-255"><a href="#UISRNN-255"><span class="linenos">255</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
+</span><span id="UISRNN-256"><a href="#UISRNN-256"><span class="linenos">256</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN-257"><a href="#UISRNN-257"><span class="linenos">257</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN-258"><a href="#UISRNN-258"><span class="linenos">258</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN-259"><a href="#UISRNN-259"><span class="linenos">259</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN-260"><a href="#UISRNN-260"><span class="linenos">260</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN-261"><a href="#UISRNN-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN-262"><a href="#UISRNN-262"><span class="linenos">262</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-263"><a href="#UISRNN-263"><span class="linenos">263</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="UISRNN-264"><a href="#UISRNN-264"><span class="linenos">264</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="UISRNN-265"><a href="#UISRNN-265"><span class="linenos">265</span></a>      <span class="c1"># use mean to predict</span>
+</span><span id="UISRNN-266"><a href="#UISRNN-266"><span class="linenos">266</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="UISRNN-267"><a href="#UISRNN-267"><span class="linenos">267</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
+</span><span id="UISRNN-268"><a href="#UISRNN-268"><span class="linenos">268</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
+</span><span id="UISRNN-269"><a href="#UISRNN-269"><span class="linenos">269</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
+</span><span id="UISRNN-270"><a href="#UISRNN-270"><span class="linenos">270</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
+</span><span id="UISRNN-271"><a href="#UISRNN-271"><span class="linenos">271</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN-272"><a href="#UISRNN-272"><span class="linenos">272</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
+</span><span id="UISRNN-273"><a href="#UISRNN-273"><span class="linenos">273</span></a>
+</span><span id="UISRNN-274"><a href="#UISRNN-274"><span class="linenos">274</span></a>      <span class="c1"># Likelihood part.</span>
+</span><span id="UISRNN-275"><a href="#UISRNN-275"><span class="linenos">275</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN-276"><a href="#UISRNN-276"><span class="linenos">276</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
+</span><span id="UISRNN-277"><a href="#UISRNN-277"><span class="linenos">277</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
+</span><span id="UISRNN-278"><a href="#UISRNN-278"><span class="linenos">278</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
+</span><span id="UISRNN-279"><a href="#UISRNN-279"><span class="linenos">279</span></a>
+</span><span id="UISRNN-280"><a href="#UISRNN-280"><span class="linenos">280</span></a>      <span class="c1"># Sigma2 prior part.</span>
+</span><span id="UISRNN-281"><a href="#UISRNN-281"><span class="linenos">281</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
+</span><span id="UISRNN-282"><a href="#UISRNN-282"><span class="linenos">282</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="UISRNN-283"><a href="#UISRNN-283"><span class="linenos">283</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
+</span><span id="UISRNN-284"><a href="#UISRNN-284"><span class="linenos">284</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
+</span><span id="UISRNN-285"><a href="#UISRNN-285"><span class="linenos">285</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
+</span><span id="UISRNN-286"><a href="#UISRNN-286"><span class="linenos">286</span></a>
+</span><span id="UISRNN-287"><a href="#UISRNN-287"><span class="linenos">287</span></a>      <span class="c1"># Regularization part.</span>
+</span><span id="UISRNN-288"><a href="#UISRNN-288"><span class="linenos">288</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
+</span><span id="UISRNN-289"><a href="#UISRNN-289"><span class="linenos">289</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
+</span><span id="UISRNN-290"><a href="#UISRNN-290"><span class="linenos">290</span></a>
+</span><span id="UISRNN-291"><a href="#UISRNN-291"><span class="linenos">291</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
+</span><span id="UISRNN-292"><a href="#UISRNN-292"><span class="linenos">292</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
+</span><span id="UISRNN-293"><a href="#UISRNN-293"><span class="linenos">293</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
+</span><span id="UISRNN-294"><a href="#UISRNN-294"><span class="linenos">294</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
+</span><span id="UISRNN-295"><a href="#UISRNN-295"><span class="linenos">295</span></a>      <span class="c1"># avoid numerical issues</span>
+</span><span id="UISRNN-296"><a href="#UISRNN-296"><span class="linenos">296</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
+</span><span id="UISRNN-297"><a href="#UISRNN-297"><span class="linenos">297</span></a>
+</span><span id="UISRNN-298"><a href="#UISRNN-298"><span class="linenos">298</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
+</span><span id="UISRNN-299"><a href="#UISRNN-299"><span class="linenos">299</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="UISRNN-300"><a href="#UISRNN-300"><span class="linenos">300</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-301"><a href="#UISRNN-301"><span class="linenos">301</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN-302"><a href="#UISRNN-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-303"><a href="#UISRNN-303"><span class="linenos">303</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-304"><a href="#UISRNN-304"><span class="linenos">304</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-305"><a href="#UISRNN-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-306"><a href="#UISRNN-306"><span class="linenos">306</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN-307"><a href="#UISRNN-307"><span class="linenos">307</span></a>                <span class="n">num_iter</span><span class="p">,</span>
+</span><span id="UISRNN-308"><a href="#UISRNN-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN-309"><a href="#UISRNN-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN-310"><a href="#UISRNN-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN-311"><a href="#UISRNN-311"><span class="linenos">311</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
+</span><span id="UISRNN-312"><a href="#UISRNN-312"><span class="linenos">312</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
+</span><span id="UISRNN-313"><a href="#UISRNN-313"><span class="linenos">313</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-314"><a href="#UISRNN-314"><span class="linenos">314</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
+</span><span id="UISRNN-315"><a href="#UISRNN-315"><span class="linenos">315</span></a>
+</span><span id="UISRNN-316"><a href="#UISRNN-316"><span class="linenos">316</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-317"><a href="#UISRNN-317"><span class="linenos">317</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
+</span><span id="UISRNN-318"><a href="#UISRNN-318"><span class="linenos">318</span></a>
+</span><span id="UISRNN-319"><a href="#UISRNN-319"><span class="linenos">319</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-320"><a href="#UISRNN-320"><span class="linenos">320</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
+</span><span id="UISRNN-321"><a href="#UISRNN-321"><span class="linenos">321</span></a><span class="sd">        concatenated training sequence:</span>
+</span><span id="UISRNN-322"><a href="#UISRNN-322"><span class="linenos">322</span></a>
+</span><span id="UISRNN-323"><a href="#UISRNN-323"><span class="linenos">323</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
+</span><span id="UISRNN-324"><a href="#UISRNN-324"><span class="linenos">324</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
+</span><span id="UISRNN-325"><a href="#UISRNN-325"><span class="linenos">325</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
+</span><span id="UISRNN-326"><a href="#UISRNN-326"><span class="linenos">326</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
+</span><span id="UISRNN-327"><a href="#UISRNN-327"><span class="linenos">327</span></a><span class="sd">           embeddings of one utterance.</span>
+</span><span id="UISRNN-328"><a href="#UISRNN-328"><span class="linenos">328</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
+</span><span id="UISRNN-329"><a href="#UISRNN-329"><span class="linenos">329</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
+</span><span id="UISRNN-330"><a href="#UISRNN-330"><span class="linenos">330</span></a><span class="sd">           for more details.</span>
+</span><span id="UISRNN-331"><a href="#UISRNN-331"><span class="linenos">331</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
+</span><span id="UISRNN-332"><a href="#UISRNN-332"><span class="linenos">332</span></a>
+</span><span id="UISRNN-333"><a href="#UISRNN-333"><span class="linenos">333</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
+</span><span id="UISRNN-334"><a href="#UISRNN-334"><span class="linenos">334</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
+</span><span id="UISRNN-335"><a href="#UISRNN-335"><span class="linenos">335</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
+</span><span id="UISRNN-336"><a href="#UISRNN-336"><span class="linenos">336</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
+</span><span id="UISRNN-337"><a href="#UISRNN-337"><span class="linenos">337</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-338"><a href="#UISRNN-338"><span class="linenos">338</span></a>
+</span><span id="UISRNN-339"><a href="#UISRNN-339"><span class="linenos">339</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-340"><a href="#UISRNN-340"><span class="linenos">340</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
+</span><span id="UISRNN-341"><a href="#UISRNN-341"><span class="linenos">341</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-342"><a href="#UISRNN-342"><span class="linenos">342</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN-343"><a href="#UISRNN-343"><span class="linenos">343</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
+</span><span id="UISRNN-344"><a href="#UISRNN-344"><span class="linenos">344</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN-345"><a href="#UISRNN-345"><span class="linenos">345</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
+</span><span id="UISRNN-346"><a href="#UISRNN-346"><span class="linenos">346</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-347"><a href="#UISRNN-347"><span class="linenos">347</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN-348"><a href="#UISRNN-348"><span class="linenos">348</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
+</span><span id="UISRNN-349"><a href="#UISRNN-349"><span class="linenos">349</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
+</span><span id="UISRNN-350"><a href="#UISRNN-350"><span class="linenos">350</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
+</span><span id="UISRNN-351"><a href="#UISRNN-351"><span class="linenos">351</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
+</span><span id="UISRNN-352"><a href="#UISRNN-352"><span class="linenos">352</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-353"><a href="#UISRNN-353"><span class="linenos">353</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
+</span><span id="UISRNN-354"><a href="#UISRNN-354"><span class="linenos">354</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
+</span><span id="UISRNN-355"><a href="#UISRNN-355"><span class="linenos">355</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN-356"><a href="#UISRNN-356"><span class="linenos">356</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
+</span><span id="UISRNN-357"><a href="#UISRNN-357"><span class="linenos">357</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
+</span><span id="UISRNN-358"><a href="#UISRNN-358"><span class="linenos">358</span></a>      <span class="k">pass</span>
+</span><span id="UISRNN-359"><a href="#UISRNN-359"><span class="linenos">359</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN-360"><a href="#UISRNN-360"><span class="linenos">360</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-361"><a href="#UISRNN-361"><span class="linenos">361</span></a>
+</span><span id="UISRNN-362"><a href="#UISRNN-362"><span class="linenos">362</span></a>    <span class="c1"># estimate transition_bias</span>
+</span><span id="UISRNN-363"><a href="#UISRNN-363"><span class="linenos">363</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN-364"><a href="#UISRNN-364"><span class="linenos">364</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN-365"><a href="#UISRNN-365"><span class="linenos">365</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
+</span><span id="UISRNN-366"><a href="#UISRNN-366"><span class="linenos">366</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
+</span><span id="UISRNN-367"><a href="#UISRNN-367"><span class="linenos">367</span></a>      <span class="c1"># set or update transition_bias</span>
+</span><span id="UISRNN-368"><a href="#UISRNN-368"><span class="linenos">368</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN-369"><a href="#UISRNN-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
+</span><span id="UISRNN-370"><a href="#UISRNN-370"><span class="linenos">370</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN-371"><a href="#UISRNN-371"><span class="linenos">371</span></a>      <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN-372"><a href="#UISRNN-372"><span class="linenos">372</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="UISRNN-373"><a href="#UISRNN-373"><span class="linenos">373</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
+</span><span id="UISRNN-374"><a href="#UISRNN-374"><span class="linenos">374</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="UISRNN-375"><a href="#UISRNN-375"><span class="linenos">375</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
+</span><span id="UISRNN-376"><a href="#UISRNN-376"><span class="linenos">376</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN-377"><a href="#UISRNN-377"><span class="linenos">377</span></a>
+</span><span id="UISRNN-378"><a href="#UISRNN-378"><span class="linenos">378</span></a>    <span class="c1"># concatenate train_sequences</span>
+</span><span id="UISRNN-379"><a href="#UISRNN-379"><span class="linenos">379</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN-380"><a href="#UISRNN-380"><span class="linenos">380</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
+</span><span id="UISRNN-381"><a href="#UISRNN-381"><span class="linenos">381</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
+</span><span id="UISRNN-382"><a href="#UISRNN-382"><span class="linenos">382</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
+</span><span id="UISRNN-383"><a href="#UISRNN-383"><span class="linenos">383</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
+</span><span id="UISRNN-384"><a href="#UISRNN-384"><span class="linenos">384</span></a>         <span class="kc">True</span><span class="p">)</span>
+</span><span id="UISRNN-385"><a href="#UISRNN-385"><span class="linenos">385</span></a>
+</span><span id="UISRNN-386"><a href="#UISRNN-386"><span class="linenos">386</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
+</span><span id="UISRNN-387"><a href="#UISRNN-387"><span class="linenos">387</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN-388"><a href="#UISRNN-388"><span class="linenos">388</span></a>
+</span><span id="UISRNN-389"><a href="#UISRNN-389"><span class="linenos">389</span></a>  <span class="k">def</span> <span class="nf">_update_beam_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">):</span>
+</span><span id="UISRNN-390"><a href="#UISRNN-390"><span class="linenos">390</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update a beam state given a look ahead sequence and known cluster</span>
+</span><span id="UISRNN-391"><a href="#UISRNN-391"><span class="linenos">391</span></a><span class="sd">    assignments.</span>
+</span><span id="UISRNN-392"><a href="#UISRNN-392"><span class="linenos">392</span></a>
+</span><span id="UISRNN-393"><a href="#UISRNN-393"><span class="linenos">393</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-394"><a href="#UISRNN-394"><span class="linenos">394</span></a><span class="sd">      beam_state: A BeamState object.</span>
+</span><span id="UISRNN-395"><a href="#UISRNN-395"><span class="linenos">395</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
+</span><span id="UISRNN-396"><a href="#UISRNN-396"><span class="linenos">396</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
+</span><span id="UISRNN-397"><a href="#UISRNN-397"><span class="linenos">397</span></a><span class="sd">        D: observation dimension</span>
+</span><span id="UISRNN-398"><a href="#UISRNN-398"><span class="linenos">398</span></a><span class="sd">      cluster_seq: Cluster assignment sequence for look_ahead_seq.</span>
+</span><span id="UISRNN-399"><a href="#UISRNN-399"><span class="linenos">399</span></a>
+</span><span id="UISRNN-400"><a href="#UISRNN-400"><span class="linenos">400</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-401"><a href="#UISRNN-401"><span class="linenos">401</span></a><span class="sd">      new_beam_state: An updated BeamState object.</span>
+</span><span id="UISRNN-402"><a href="#UISRNN-402"><span class="linenos">402</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-403"><a href="#UISRNN-403"><span class="linenos">403</span></a>
+</span><span id="UISRNN-404"><a href="#UISRNN-404"><span class="linenos">404</span></a>    <span class="n">loss</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="UISRNN-405"><a href="#UISRNN-405"><span class="linenos">405</span></a>    <span class="n">new_beam_state</span> <span class="o">=</span> <span class="n">BeamState</span><span class="p">(</span><span class="n">beam_state</span><span class="p">)</span>
+</span><span id="UISRNN-406"><a href="#UISRNN-406"><span class="linenos">406</span></a>    <span class="k">for</span> <span class="n">sub_idx</span><span class="p">,</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster_seq</span><span class="p">):</span>
+</span><span id="UISRNN-407"><a href="#UISRNN-407"><span class="linenos">407</span></a>      <span class="k">if</span> <span class="n">cluster</span> <span class="o">&gt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># invalid trace</span>
+</span><span id="UISRNN-408"><a href="#UISRNN-408"><span class="linenos">408</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-409"><a href="#UISRNN-409"><span class="linenos">409</span></a>        <span class="k">break</span>
+</span><span id="UISRNN-410"><a href="#UISRNN-410"><span class="linenos">410</span></a>      <span class="k">elif</span> <span class="n">cluster</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># existing cluster</span>
+</span><span id="UISRNN-411"><a href="#UISRNN-411"><span class="linenos">411</span></a>        <span class="n">last_cluster</span> <span class="o">=</span> <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="UISRNN-412"><a href="#UISRNN-412"><span class="linenos">412</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN-413"><a href="#UISRNN-413"><span class="linenos">413</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]),</span>
+</span><span id="UISRNN-414"><a href="#UISRNN-414"><span class="linenos">414</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
+</span><span id="UISRNN-415"><a href="#UISRNN-415"><span class="linenos">415</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
+</span><span id="UISRNN-416"><a href="#UISRNN-416"><span class="linenos">416</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">==</span> <span class="n">last_cluster</span><span class="p">:</span>
+</span><span id="UISRNN-417"><a href="#UISRNN-417"><span class="linenos">417</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span>
+</span><span id="UISRNN-418"><a href="#UISRNN-418"><span class="linenos">418</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN-419"><a href="#UISRNN-419"><span class="linenos">419</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-420"><a href="#UISRNN-420"><span class="linenos">420</span></a>              <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-421"><a href="#UISRNN-421"><span class="linenos">421</span></a>                  <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
+</span><span id="UISRNN-422"><a href="#UISRNN-422"><span class="linenos">422</span></a>        <span class="c1"># update new mean and new hidden</span>
+</span><span id="UISRNN-423"><a href="#UISRNN-423"><span class="linenos">423</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
+</span><span id="UISRNN-424"><a href="#UISRNN-424"><span class="linenos">424</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
+</span><span id="UISRNN-425"><a href="#UISRNN-425"><span class="linenos">425</span></a>            <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span>
+</span><span id="UISRNN-426"><a href="#UISRNN-426"><span class="linenos">426</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span><span class="o">*</span><span class="p">(</span>
+</span><span id="UISRNN-427"><a href="#UISRNN-427"><span class="linenos">427</span></a>            <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span> <span class="o">-</span>
+</span><span id="UISRNN-428"><a href="#UISRNN-428"><span class="linenos">428</span></a>            <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span> <span class="o">+</span> <span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="UISRNN-429"><a href="#UISRNN-429"><span class="linenos">429</span></a>                <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span>
+</span><span id="UISRNN-430"><a href="#UISRNN-430"><span class="linenos">430</span></a>                    <span class="nb">float</span><span class="p">)</span>  <span class="c1"># use mean to predict</span>
+</span><span id="UISRNN-431"><a href="#UISRNN-431"><span class="linenos">431</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
+</span><span id="UISRNN-432"><a href="#UISRNN-432"><span class="linenos">432</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">!=</span> <span class="n">last_cluster</span><span class="p">:</span>
+</span><span id="UISRNN-433"><a href="#UISRNN-433"><span class="linenos">433</span></a>          <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="UISRNN-434"><a href="#UISRNN-434"><span class="linenos">434</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
+</span><span id="UISRNN-435"><a href="#UISRNN-435"><span class="linenos">435</span></a>      <span class="k">else</span><span class="p">:</span>  <span class="c1"># new cluster</span>
+</span><span id="UISRNN-436"><a href="#UISRNN-436"><span class="linenos">436</span></a>        <span class="n">init_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="UISRNN-437"><a href="#UISRNN-437"><span class="linenos">437</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="UISRNN-438"><a href="#UISRNN-438"><span class="linenos">438</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-439"><a href="#UISRNN-439"><span class="linenos">439</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">init_input</span><span class="p">,</span>
+</span><span id="UISRNN-440"><a href="#UISRNN-440"><span class="linenos">440</span></a>                                      <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="p">)</span>
+</span><span id="UISRNN-441"><a href="#UISRNN-441"><span class="linenos">441</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN-442"><a href="#UISRNN-442"><span class="linenos">442</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">mean</span><span class="p">),</span>
+</span><span id="UISRNN-443"><a href="#UISRNN-443"><span class="linenos">443</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
+</span><span id="UISRNN-444"><a href="#UISRNN-444"><span class="linenos">444</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
+</span><span id="UISRNN-445"><a href="#UISRNN-445"><span class="linenos">445</span></a>        <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-446"><a href="#UISRNN-446"><span class="linenos">446</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-447"><a href="#UISRNN-447"><span class="linenos">447</span></a>                <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
+</span><span id="UISRNN-448"><a href="#UISRNN-448"><span class="linenos">448</span></a>        <span class="c1"># update new min and new hidden</span>
+</span><span id="UISRNN-449"><a href="#UISRNN-449"><span class="linenos">449</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
+</span><span id="UISRNN-450"><a href="#UISRNN-450"><span class="linenos">450</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
+</span><span id="UISRNN-451"><a href="#UISRNN-451"><span class="linenos">451</span></a>            <span class="n">hidden</span><span class="p">)</span>
+</span><span id="UISRNN-452"><a href="#UISRNN-452"><span class="linenos">452</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">)</span>
+</span><span id="UISRNN-453"><a href="#UISRNN-453"><span class="linenos">453</span></a>      <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">+=</span> <span class="n">loss</span>
+</span><span id="UISRNN-454"><a href="#UISRNN-454"><span class="linenos">454</span></a>    <span class="k">return</span> <span class="n">new_beam_state</span>
+</span><span id="UISRNN-455"><a href="#UISRNN-455"><span class="linenos">455</span></a>
+</span><span id="UISRNN-456"><a href="#UISRNN-456"><span class="linenos">456</span></a>  <span class="k">def</span> <span class="nf">_calculate_score</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">):</span>
+</span><span id="UISRNN-457"><a href="#UISRNN-457"><span class="linenos">457</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Calculate negative log likelihoods for all possible state allocations</span>
+</span><span id="UISRNN-458"><a href="#UISRNN-458"><span class="linenos">458</span></a><span class="sd">       of a look ahead sequence, according to the current beam state.</span>
+</span><span id="UISRNN-459"><a href="#UISRNN-459"><span class="linenos">459</span></a>
+</span><span id="UISRNN-460"><a href="#UISRNN-460"><span class="linenos">460</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-461"><a href="#UISRNN-461"><span class="linenos">461</span></a><span class="sd">      beam_state: A BeamState object.</span>
+</span><span id="UISRNN-462"><a href="#UISRNN-462"><span class="linenos">462</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
+</span><span id="UISRNN-463"><a href="#UISRNN-463"><span class="linenos">463</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
+</span><span id="UISRNN-464"><a href="#UISRNN-464"><span class="linenos">464</span></a><span class="sd">        D: observation dimension</span>
+</span><span id="UISRNN-465"><a href="#UISRNN-465"><span class="linenos">465</span></a>
+</span><span id="UISRNN-466"><a href="#UISRNN-466"><span class="linenos">466</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-467"><a href="#UISRNN-467"><span class="linenos">467</span></a><span class="sd">      beam_score_set: a set of scores for each possible state allocation.</span>
+</span><span id="UISRNN-468"><a href="#UISRNN-468"><span class="linenos">468</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-469"><a href="#UISRNN-469"><span class="linenos">469</span></a>
+</span><span id="UISRNN-470"><a href="#UISRNN-470"><span class="linenos">470</span></a>    <span class="n">look_ahead</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN-471"><a href="#UISRNN-471"><span class="linenos">471</span></a>    <span class="n">beam_num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span>
+</span><span id="UISRNN-472"><a href="#UISRNN-472"><span class="linenos">472</span></a>    <span class="n">beam_score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="UISRNN-473"><a href="#UISRNN-473"><span class="linenos">473</span></a>        <span class="n">beam_num_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">look_ahead</span><span class="p">))</span>
+</span><span id="UISRNN-474"><a href="#UISRNN-474"><span class="linenos">474</span></a>    <span class="k">for</span> <span class="n">cluster_seq</span><span class="p">,</span> <span class="n">_</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">ndenumerate</span><span class="p">(</span><span class="n">beam_score_set</span><span class="p">):</span>
+</span><span id="UISRNN-475"><a href="#UISRNN-475"><span class="linenos">475</span></a>      <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span>
+</span><span id="UISRNN-476"><a href="#UISRNN-476"><span class="linenos">476</span></a>                                                   <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="UISRNN-477"><a href="#UISRNN-477"><span class="linenos">477</span></a>      <span class="n">beam_score_set</span><span class="p">[</span><span class="n">cluster_seq</span><span class="p">]</span> <span class="o">=</span> <span class="n">updated_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span>
+</span><span id="UISRNN-478"><a href="#UISRNN-478"><span class="linenos">478</span></a>    <span class="k">return</span> <span class="n">beam_score_set</span>
+</span><span id="UISRNN-479"><a href="#UISRNN-479"><span class="linenos">479</span></a>
+</span><span id="UISRNN-480"><a href="#UISRNN-480"><span class="linenos">480</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-481"><a href="#UISRNN-481"><span class="linenos">481</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
+</span><span id="UISRNN-482"><a href="#UISRNN-482"><span class="linenos">482</span></a>
+</span><span id="UISRNN-483"><a href="#UISRNN-483"><span class="linenos">483</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-484"><a href="#UISRNN-484"><span class="linenos">484</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
+</span><span id="UISRNN-485"><a href="#UISRNN-485"><span class="linenos">485</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN-486"><a href="#UISRNN-486"><span class="linenos">486</span></a>
+</span><span id="UISRNN-487"><a href="#UISRNN-487"><span class="linenos">487</span></a><span class="sd">        - `N`: length of one test utterance.</span>
+</span><span id="UISRNN-488"><a href="#UISRNN-488"><span class="linenos">488</span></a><span class="sd">        - `D` : observation dimension.</span>
+</span><span id="UISRNN-489"><a href="#UISRNN-489"><span class="linenos">489</span></a>
+</span><span id="UISRNN-490"><a href="#UISRNN-490"><span class="linenos">490</span></a><span class="sd">        For example:</span>
+</span><span id="UISRNN-491"><a href="#UISRNN-491"><span class="linenos">491</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-492"><a href="#UISRNN-492"><span class="linenos">492</span></a><span class="sd">      test_sequence =</span>
+</span><span id="UISRNN-493"><a href="#UISRNN-493"><span class="linenos">493</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-494"><a href="#UISRNN-494"><span class="linenos">494</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-495"><a href="#UISRNN-495"><span class="linenos">495</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-496"><a href="#UISRNN-496"><span class="linenos">496</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-497"><a href="#UISRNN-497"><span class="linenos">497</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-498"><a href="#UISRNN-498"><span class="linenos">498</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-499"><a href="#UISRNN-499"><span class="linenos">499</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN-500"><a href="#UISRNN-500"><span class="linenos">500</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-501"><a href="#UISRNN-501"><span class="linenos">501</span></a>
+</span><span id="UISRNN-502"><a href="#UISRNN-502"><span class="linenos">502</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-503"><a href="#UISRNN-503"><span class="linenos">503</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
+</span><span id="UISRNN-504"><a href="#UISRNN-504"><span class="linenos">504</span></a><span class="sd">        an array of integers, of size `N`.</span>
+</span><span id="UISRNN-505"><a href="#UISRNN-505"><span class="linenos">505</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
+</span><span id="UISRNN-506"><a href="#UISRNN-506"><span class="linenos">506</span></a>
+</span><span id="UISRNN-507"><a href="#UISRNN-507"><span class="linenos">507</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-508"><a href="#UISRNN-508"><span class="linenos">508</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
+</span><span id="UISRNN-509"><a href="#UISRNN-509"><span class="linenos">509</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
+</span><span id="UISRNN-510"><a href="#UISRNN-510"><span class="linenos">510</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-511"><a href="#UISRNN-511"><span class="linenos">511</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN-512"><a href="#UISRNN-512"><span class="linenos">512</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN-513"><a href="#UISRNN-513"><span class="linenos">513</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN-514"><a href="#UISRNN-514"><span class="linenos">514</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-515"><a href="#UISRNN-515"><span class="linenos">515</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN-516"><a href="#UISRNN-516"><span class="linenos">516</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN-517"><a href="#UISRNN-517"><span class="linenos">517</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-518"><a href="#UISRNN-518"><span class="linenos">518</span></a>    <span class="c1"># check size</span>
+</span><span id="UISRNN-519"><a href="#UISRNN-519"><span class="linenos">519</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN-520"><a href="#UISRNN-520"><span class="linenos">520</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN-521"><a href="#UISRNN-521"><span class="linenos">521</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN-522"><a href="#UISRNN-522"><span class="linenos">522</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-523"><a href="#UISRNN-523"><span class="linenos">523</span></a>
+</span><span id="UISRNN-524"><a href="#UISRNN-524"><span class="linenos">524</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+</span><span id="UISRNN-525"><a href="#UISRNN-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN-526"><a href="#UISRNN-526"><span class="linenos">526</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="UISRNN-527"><a href="#UISRNN-527"><span class="linenos">527</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-528"><a href="#UISRNN-528"><span class="linenos">528</span></a>    <span class="c1"># bookkeeping for beam search</span>
+</span><span id="UISRNN-529"><a href="#UISRNN-529"><span class="linenos">529</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
+</span><span id="UISRNN-530"><a href="#UISRNN-530"><span class="linenos">530</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
+</span><span id="UISRNN-531"><a href="#UISRNN-531"><span class="linenos">531</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
+</span><span id="UISRNN-532"><a href="#UISRNN-532"><span class="linenos">532</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
+</span><span id="UISRNN-533"><a href="#UISRNN-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
+</span><span id="UISRNN-534"><a href="#UISRNN-534"><span class="linenos">534</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="UISRNN-535"><a href="#UISRNN-535"><span class="linenos">535</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="UISRNN-536"><a href="#UISRNN-536"><span class="linenos">536</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="UISRNN-537"><a href="#UISRNN-537"><span class="linenos">537</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
+</span><span id="UISRNN-538"><a href="#UISRNN-538"><span class="linenos">538</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
+</span><span id="UISRNN-539"><a href="#UISRNN-539"><span class="linenos">539</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
+</span><span id="UISRNN-540"><a href="#UISRNN-540"><span class="linenos">540</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
+</span><span id="UISRNN-541"><a href="#UISRNN-541"><span class="linenos">541</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+</span><span id="UISRNN-542"><a href="#UISRNN-542"><span class="linenos">542</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
+</span><span id="UISRNN-543"><a href="#UISRNN-543"><span class="linenos">543</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
+</span><span id="UISRNN-544"><a href="#UISRNN-544"><span class="linenos">544</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
+</span><span id="UISRNN-545"><a href="#UISRNN-545"><span class="linenos">545</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
+</span><span id="UISRNN-546"><a href="#UISRNN-546"><span class="linenos">546</span></a>      <span class="c1"># find top scores</span>
+</span><span id="UISRNN-547"><a href="#UISRNN-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-548"><a href="#UISRNN-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="UISRNN-549"><a href="#UISRNN-549"><span class="linenos">549</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
+</span><span id="UISRNN-550"><a href="#UISRNN-550"><span class="linenos">550</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-551"><a href="#UISRNN-551"><span class="linenos">551</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN-552"><a href="#UISRNN-552"><span class="linenos">552</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
+</span><span id="UISRNN-553"><a href="#UISRNN-553"><span class="linenos">553</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
+</span><span id="UISRNN-554"><a href="#UISRNN-554"><span class="linenos">554</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
+</span><span id="UISRNN-555"><a href="#UISRNN-555"><span class="linenos">555</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
+</span><span id="UISRNN-556"><a href="#UISRNN-556"><span class="linenos">556</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
+</span><span id="UISRNN-557"><a href="#UISRNN-557"><span class="linenos">557</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="UISRNN-558"><a href="#UISRNN-558"><span class="linenos">558</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
+</span><span id="UISRNN-559"><a href="#UISRNN-559"><span class="linenos">559</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="UISRNN-560"><a href="#UISRNN-560"><span class="linenos">560</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
+</span><span id="UISRNN-561"><a href="#UISRNN-561"><span class="linenos">561</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
+</span><span id="UISRNN-562"><a href="#UISRNN-562"><span class="linenos">562</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
+</span><span id="UISRNN-563"><a href="#UISRNN-563"><span class="linenos">563</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
+</span><span id="UISRNN-564"><a href="#UISRNN-564"><span class="linenos">564</span></a>
+</span><span id="UISRNN-565"><a href="#UISRNN-565"><span class="linenos">565</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-566"><a href="#UISRNN-566"><span class="linenos">566</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
+</span><span id="UISRNN-567"><a href="#UISRNN-567"><span class="linenos">567</span></a>
+</span><span id="UISRNN-568"><a href="#UISRNN-568"><span class="linenos">568</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-569"><a href="#UISRNN-569"><span class="linenos">569</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
+</span><span id="UISRNN-570"><a href="#UISRNN-570"><span class="linenos">570</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="UISRNN-571"><a href="#UISRNN-571"><span class="linenos">571</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
+</span><span id="UISRNN-572"><a href="#UISRNN-572"><span class="linenos">572</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-573"><a href="#UISRNN-573"><span class="linenos">573</span></a>
+</span><span id="UISRNN-574"><a href="#UISRNN-574"><span class="linenos">574</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-575"><a href="#UISRNN-575"><span class="linenos">575</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
+</span><span id="UISRNN-576"><a href="#UISRNN-576"><span class="linenos">576</span></a>
+</span><span id="UISRNN-577"><a href="#UISRNN-577"><span class="linenos">577</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
+</span><span id="UISRNN-578"><a href="#UISRNN-578"><span class="linenos">578</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
+</span><span id="UISRNN-579"><a href="#UISRNN-579"><span class="linenos">579</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
+</span><span id="UISRNN-580"><a href="#UISRNN-580"><span class="linenos">580</span></a><span class="sd">           be a 1-dim list of strings</span>
+</span><span id="UISRNN-581"><a href="#UISRNN-581"><span class="linenos">581</span></a>
+</span><span id="UISRNN-582"><a href="#UISRNN-582"><span class="linenos">582</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-583"><a href="#UISRNN-583"><span class="linenos">583</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="UISRNN-584"><a href="#UISRNN-584"><span class="linenos">584</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-585"><a href="#UISRNN-585"><span class="linenos">585</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN-586"><a href="#UISRNN-586"><span class="linenos">586</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN-587"><a href="#UISRNN-587"><span class="linenos">587</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN-588"><a href="#UISRNN-588"><span class="linenos">588</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN-589"><a href="#UISRNN-589"><span class="linenos">589</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN-590"><a href="#UISRNN-590"><span class="linenos">590</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
+</span><span id="UISRNN-591"><a href="#UISRNN-591"><span class="linenos">591</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1025,31 +1023,31 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN.__init__"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.__init__-83"><a href="#UISRNN.__init__-83"><span class="linenos"> 83</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.__init__-84"><a href="#UISRNN.__init__-84"><span class="linenos"> 84</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
-</span><span id="UISRNN.__init__-85"><a href="#UISRNN.__init__-85"><span class="linenos"> 85</span></a>
-</span><span id="UISRNN.__init__-86"><a href="#UISRNN.__init__-86"><span class="linenos"> 86</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.__init__-87"><a href="#UISRNN.__init__-87"><span class="linenos"> 87</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.__init__-88"><a href="#UISRNN.__init__-88"><span class="linenos"> 88</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.__init__-89"><a href="#UISRNN.__init__-89"><span class="linenos"> 89</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
-</span><span id="UISRNN.__init__-90"><a href="#UISRNN.__init__-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
-</span><span id="UISRNN.__init__-91"><a href="#UISRNN.__init__-91"><span class="linenos"> 91</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-92"><a href="#UISRNN.__init__-92"><span class="linenos"> 92</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="UISRNN.__init__-93"><a href="#UISRNN.__init__-93"><span class="linenos"> 93</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN.__init__-94"><a href="#UISRNN.__init__-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-95"><a href="#UISRNN.__init__-95"><span class="linenos"> 95</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.__init__-96"><a href="#UISRNN.__init__-96"><span class="linenos"> 96</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.__init__-97"><a href="#UISRNN.__init__-97"><span class="linenos"> 97</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
-</span><span id="UISRNN.__init__-98"><a href="#UISRNN.__init__-98"><span class="linenos"> 98</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-99"><a href="#UISRNN.__init__-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-100"><a href="#UISRNN.__init__-100"><span class="linenos">100</span></a>    <span class="c1"># initial values of variables</span>
-</span><span id="UISRNN.__init__-101"><a href="#UISRNN.__init__-101"><span class="linenos">101</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="UISRNN.__init__-102"><a href="#UISRNN.__init__-102"><span class="linenos">102</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.__init__-103"><a href="#UISRNN.__init__-103"><span class="linenos">103</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.__init__-104"><a href="#UISRNN.__init__-104"><span class="linenos">104</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
-</span><span id="UISRNN.__init__-105"><a href="#UISRNN.__init__-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="UISRNN.__init__-106"><a href="#UISRNN.__init__-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
-</span><span id="UISRNN.__init__-107"><a href="#UISRNN.__init__-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.__init__-84"><a href="#UISRNN.__init__-84"><span class="linenos"> 84</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.__init__-85"><a href="#UISRNN.__init__-85"><span class="linenos"> 85</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
+</span><span id="UISRNN.__init__-86"><a href="#UISRNN.__init__-86"><span class="linenos"> 86</span></a>
+</span><span id="UISRNN.__init__-87"><a href="#UISRNN.__init__-87"><span class="linenos"> 87</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.__init__-88"><a href="#UISRNN.__init__-88"><span class="linenos"> 88</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.__init__-89"><a href="#UISRNN.__init__-89"><span class="linenos"> 89</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.__init__-90"><a href="#UISRNN.__init__-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
+</span><span id="UISRNN.__init__-91"><a href="#UISRNN.__init__-91"><span class="linenos"> 91</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
+</span><span id="UISRNN.__init__-92"><a href="#UISRNN.__init__-92"><span class="linenos"> 92</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-93"><a href="#UISRNN.__init__-93"><span class="linenos"> 93</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="UISRNN.__init__-94"><a href="#UISRNN.__init__-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN.__init__-95"><a href="#UISRNN.__init__-95"><span class="linenos"> 95</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-96"><a href="#UISRNN.__init__-96"><span class="linenos"> 96</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.__init__-97"><a href="#UISRNN.__init__-97"><span class="linenos"> 97</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.__init__-98"><a href="#UISRNN.__init__-98"><span class="linenos"> 98</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
+</span><span id="UISRNN.__init__-99"><a href="#UISRNN.__init__-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-100"><a href="#UISRNN.__init__-100"><span class="linenos">100</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-101"><a href="#UISRNN.__init__-101"><span class="linenos">101</span></a>    <span class="c1"># initial values of variables</span>
+</span><span id="UISRNN.__init__-102"><a href="#UISRNN.__init__-102"><span class="linenos">102</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="UISRNN.__init__-103"><a href="#UISRNN.__init__-103"><span class="linenos">103</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.__init__-104"><a href="#UISRNN.__init__-104"><span class="linenos">104</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.__init__-105"><a href="#UISRNN.__init__-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
+</span><span id="UISRNN.__init__-106"><a href="#UISRNN.__init__-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="UISRNN.__init__-107"><a href="#UISRNN.__init__-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
+</span><span id="UISRNN.__init__-108"><a href="#UISRNN.__init__-108"><span class="linenos">108</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">colortimelog</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1193,19 +1191,19 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN.save"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.save-135"><a href="#UISRNN.save-135"><span class="linenos">135</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN.save-136"><a href="#UISRNN.save-136"><span class="linenos">136</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
-</span><span id="UISRNN.save-137"><a href="#UISRNN.save-137"><span class="linenos">137</span></a>
-</span><span id="UISRNN.save-138"><a href="#UISRNN.save-138"><span class="linenos">138</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.save-139"><a href="#UISRNN.save-139"><span class="linenos">139</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN.save-140"><a href="#UISRNN.save-140"><span class="linenos">140</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.save-141"><a href="#UISRNN.save-141"><span class="linenos">141</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
-</span><span id="UISRNN.save-142"><a href="#UISRNN.save-142"><span class="linenos">142</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
-</span><span id="UISRNN.save-143"><a href="#UISRNN.save-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
-</span><span id="UISRNN.save-144"><a href="#UISRNN.save-144"><span class="linenos">144</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN.save-145"><a href="#UISRNN.save-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
-</span><span id="UISRNN.save-146"><a href="#UISRNN.save-146"><span class="linenos">146</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="UISRNN.save-147"><a href="#UISRNN.save-147"><span class="linenos">147</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.save-136"><a href="#UISRNN.save-136"><span class="linenos">136</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN.save-137"><a href="#UISRNN.save-137"><span class="linenos">137</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
+</span><span id="UISRNN.save-138"><a href="#UISRNN.save-138"><span class="linenos">138</span></a>
+</span><span id="UISRNN.save-139"><a href="#UISRNN.save-139"><span class="linenos">139</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.save-140"><a href="#UISRNN.save-140"><span class="linenos">140</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN.save-141"><a href="#UISRNN.save-141"><span class="linenos">141</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.save-142"><a href="#UISRNN.save-142"><span class="linenos">142</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
+</span><span id="UISRNN.save-143"><a href="#UISRNN.save-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
+</span><span id="UISRNN.save-144"><a href="#UISRNN.save-144"><span class="linenos">144</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
+</span><span id="UISRNN.save-145"><a href="#UISRNN.save-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN.save-146"><a href="#UISRNN.save-146"><span class="linenos">146</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
+</span><span id="UISRNN.save-147"><a href="#UISRNN.save-147"><span class="linenos">147</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="UISRNN.save-148"><a href="#UISRNN.save-148"><span class="linenos">148</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1228,28 +1226,28 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN.load"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.load-149"><a href="#UISRNN.load-149"><span class="linenos">149</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN.load-150"><a href="#UISRNN.load-150"><span class="linenos">150</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
-</span><span id="UISRNN.load-151"><a href="#UISRNN.load-151"><span class="linenos">151</span></a>
-</span><span id="UISRNN.load-152"><a href="#UISRNN.load-152"><span class="linenos">152</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.load-153"><a href="#UISRNN.load-153"><span class="linenos">153</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN.load-154"><a href="#UISRNN.load-154"><span class="linenos">154</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.load-155"><a href="#UISRNN.load-155"><span class="linenos">155</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
-</span><span id="UISRNN.load-156"><a href="#UISRNN.load-156"><span class="linenos">156</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-157"><a href="#UISRNN.load-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.load-158"><a href="#UISRNN.load-158"><span class="linenos">158</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.load-159"><a href="#UISRNN.load-159"><span class="linenos">159</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-160"><a href="#UISRNN.load-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
-</span><span id="UISRNN.load-161"><a href="#UISRNN.load-161"><span class="linenos">161</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-162"><a href="#UISRNN.load-162"><span class="linenos">162</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-163"><a href="#UISRNN.load-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.load-164"><a href="#UISRNN.load-164"><span class="linenos">164</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.load-165"><a href="#UISRNN.load-165"><span class="linenos">165</span></a>
-</span><span id="UISRNN.load-166"><a href="#UISRNN.load-166"><span class="linenos">166</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.load-167"><a href="#UISRNN.load-167"><span class="linenos">167</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
-</span><span id="UISRNN.load-168"><a href="#UISRNN.load-168"><span class="linenos">168</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN.load-169"><a href="#UISRNN.load-169"><span class="linenos">169</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
-</span><span id="UISRNN.load-170"><a href="#UISRNN.load-170"><span class="linenos">170</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.load-150"><a href="#UISRNN.load-150"><span class="linenos">150</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN.load-151"><a href="#UISRNN.load-151"><span class="linenos">151</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
+</span><span id="UISRNN.load-152"><a href="#UISRNN.load-152"><span class="linenos">152</span></a>
+</span><span id="UISRNN.load-153"><a href="#UISRNN.load-153"><span class="linenos">153</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.load-154"><a href="#UISRNN.load-154"><span class="linenos">154</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN.load-155"><a href="#UISRNN.load-155"><span class="linenos">155</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.load-156"><a href="#UISRNN.load-156"><span class="linenos">156</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
+</span><span id="UISRNN.load-157"><a href="#UISRNN.load-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-158"><a href="#UISRNN.load-158"><span class="linenos">158</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.load-159"><a href="#UISRNN.load-159"><span class="linenos">159</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.load-160"><a href="#UISRNN.load-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-161"><a href="#UISRNN.load-161"><span class="linenos">161</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
+</span><span id="UISRNN.load-162"><a href="#UISRNN.load-162"><span class="linenos">162</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-163"><a href="#UISRNN.load-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-164"><a href="#UISRNN.load-164"><span class="linenos">164</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.load-165"><a href="#UISRNN.load-165"><span class="linenos">165</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.load-166"><a href="#UISRNN.load-166"><span class="linenos">166</span></a>
+</span><span id="UISRNN.load-167"><a href="#UISRNN.load-167"><span class="linenos">167</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.load-168"><a href="#UISRNN.load-168"><span class="linenos">168</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
+</span><span id="UISRNN.load-169"><a href="#UISRNN.load-169"><span class="linenos">169</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN.load-170"><a href="#UISRNN.load-170"><span class="linenos">170</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
+</span><span id="UISRNN.load-171"><a href="#UISRNN.load-171"><span class="linenos">171</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
 </span></pre></div>
 
 
@@ -1272,148 +1270,148 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN.fit_concatenated"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit_concatenated-172"><a href="#UISRNN.fit_concatenated-172"><span class="linenos">172</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-173"><a href="#UISRNN.fit_concatenated-173"><span class="linenos">173</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
-</span><span id="UISRNN.fit_concatenated-174"><a href="#UISRNN.fit_concatenated-174"><span class="linenos">174</span></a>
-</span><span id="UISRNN.fit_concatenated-175"><a href="#UISRNN.fit_concatenated-175"><span class="linenos">175</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.fit_concatenated-176"><a href="#UISRNN.fit_concatenated-176"><span class="linenos">176</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
-</span><span id="UISRNN.fit_concatenated-177"><a href="#UISRNN.fit_concatenated-177"><span class="linenos">177</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN.fit_concatenated-178"><a href="#UISRNN.fit_concatenated-178"><span class="linenos">178</span></a>
-</span><span id="UISRNN.fit_concatenated-179"><a href="#UISRNN.fit_concatenated-179"><span class="linenos">179</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
-</span><span id="UISRNN.fit_concatenated-180"><a href="#UISRNN.fit_concatenated-180"><span class="linenos">180</span></a><span class="sd">        - `D`: observation dimension.</span>
-</span><span id="UISRNN.fit_concatenated-181"><a href="#UISRNN.fit_concatenated-181"><span class="linenos">181</span></a>
-</span><span id="UISRNN.fit_concatenated-182"><a href="#UISRNN.fit_concatenated-182"><span class="linenos">182</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN.fit_concatenated-183"><a href="#UISRNN.fit_concatenated-183"><span class="linenos">183</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-184"><a href="#UISRNN.fit_concatenated-184"><span class="linenos">184</span></a><span class="sd">      train_sequence =</span>
-</span><span id="UISRNN.fit_concatenated-185"><a href="#UISRNN.fit_concatenated-185"><span class="linenos">185</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN.fit_concatenated-186"><a href="#UISRNN.fit_concatenated-186"><span class="linenos">186</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN.fit_concatenated-187"><a href="#UISRNN.fit_concatenated-187"><span class="linenos">187</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN.fit_concatenated-188"><a href="#UISRNN.fit_concatenated-188"><span class="linenos">188</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN.fit_concatenated-189"><a href="#UISRNN.fit_concatenated-189"><span class="linenos">189</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN.fit_concatenated-190"><a href="#UISRNN.fit_concatenated-190"><span class="linenos">190</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-191"><a href="#UISRNN.fit_concatenated-191"><span class="linenos">191</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN.fit_concatenated-192"><a href="#UISRNN.fit_concatenated-192"><span class="linenos">192</span></a>
-</span><span id="UISRNN.fit_concatenated-193"><a href="#UISRNN.fit_concatenated-193"><span class="linenos">193</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
-</span><span id="UISRNN.fit_concatenated-194"><a href="#UISRNN.fit_concatenated-194"><span class="linenos">194</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
-</span><span id="UISRNN.fit_concatenated-195"><a href="#UISRNN.fit_concatenated-195"><span class="linenos">195</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
-</span><span id="UISRNN.fit_concatenated-196"><a href="#UISRNN.fit_concatenated-196"><span class="linenos">196</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN.fit_concatenated-197"><a href="#UISRNN.fit_concatenated-197"><span class="linenos">197</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-198"><a href="#UISRNN.fit_concatenated-198"><span class="linenos">198</span></a><span class="sd">      train_cluster_id =</span>
-</span><span id="UISRNN.fit_concatenated-199"><a href="#UISRNN.fit_concatenated-199"><span class="linenos">199</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
-</span><span id="UISRNN.fit_concatenated-200"><a href="#UISRNN.fit_concatenated-200"><span class="linenos">200</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-201"><a href="#UISRNN.fit_concatenated-201"><span class="linenos">201</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
-</span><span id="UISRNN.fit_concatenated-202"><a href="#UISRNN.fit_concatenated-202"><span class="linenos">202</span></a>
-</span><span id="UISRNN.fit_concatenated-203"><a href="#UISRNN.fit_concatenated-203"><span class="linenos">203</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
-</span><span id="UISRNN.fit_concatenated-204"><a href="#UISRNN.fit_concatenated-204"><span class="linenos">204</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
-</span><span id="UISRNN.fit_concatenated-205"><a href="#UISRNN.fit_concatenated-205"><span class="linenos">205</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.fit_concatenated-206"><a href="#UISRNN.fit_concatenated-206"><span class="linenos">206</span></a>
-</span><span id="UISRNN.fit_concatenated-207"><a href="#UISRNN.fit_concatenated-207"><span class="linenos">207</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.fit_concatenated-208"><a href="#UISRNN.fit_concatenated-208"><span class="linenos">208</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
-</span><span id="UISRNN.fit_concatenated-209"><a href="#UISRNN.fit_concatenated-209"><span class="linenos">209</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
-</span><span id="UISRNN.fit_concatenated-210"><a href="#UISRNN.fit_concatenated-210"><span class="linenos">210</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.fit_concatenated-211"><a href="#UISRNN.fit_concatenated-211"><span class="linenos">211</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN.fit_concatenated-212"><a href="#UISRNN.fit_concatenated-212"><span class="linenos">212</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN.fit_concatenated-213"><a href="#UISRNN.fit_concatenated-213"><span class="linenos">213</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-214"><a href="#UISRNN.fit_concatenated-214"><span class="linenos">214</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-215"><a href="#UISRNN.fit_concatenated-215"><span class="linenos">215</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-216"><a href="#UISRNN.fit_concatenated-216"><span class="linenos">216</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-217"><a href="#UISRNN.fit_concatenated-217"><span class="linenos">217</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN.fit_concatenated-218"><a href="#UISRNN.fit_concatenated-218"><span class="linenos">218</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
-</span><span id="UISRNN.fit_concatenated-219"><a href="#UISRNN.fit_concatenated-219"><span class="linenos">219</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-220"><a href="#UISRNN.fit_concatenated-220"><span class="linenos">220</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN.fit_concatenated-221"><a href="#UISRNN.fit_concatenated-221"><span class="linenos">221</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-222"><a href="#UISRNN.fit_concatenated-222"><span class="linenos">222</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-223"><a href="#UISRNN.fit_concatenated-223"><span class="linenos">223</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-224"><a href="#UISRNN.fit_concatenated-224"><span class="linenos">224</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-225"><a href="#UISRNN.fit_concatenated-225"><span class="linenos">225</span></a>    <span class="c1"># check length and size</span>
-</span><span id="UISRNN.fit_concatenated-226"><a href="#UISRNN.fit_concatenated-226"><span class="linenos">226</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN.fit_concatenated-227"><a href="#UISRNN.fit_concatenated-227"><span class="linenos">227</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-228"><a href="#UISRNN.fit_concatenated-228"><span class="linenos">228</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN.fit_concatenated-229"><a href="#UISRNN.fit_concatenated-229"><span class="linenos">229</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-230"><a href="#UISRNN.fit_concatenated-230"><span class="linenos">230</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-231"><a href="#UISRNN.fit_concatenated-231"><span class="linenos">231</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
-</span><span id="UISRNN.fit_concatenated-232"><a href="#UISRNN.fit_concatenated-232"><span class="linenos">232</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-233"><a href="#UISRNN.fit_concatenated-233"><span class="linenos">233</span></a>
-</span><span id="UISRNN.fit_concatenated-234"><a href="#UISRNN.fit_concatenated-234"><span class="linenos">234</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-235"><a href="#UISRNN.fit_concatenated-235"><span class="linenos">235</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-236"><a href="#UISRNN.fit_concatenated-236"><span class="linenos">236</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-237"><a href="#UISRNN.fit_concatenated-237"><span class="linenos">237</span></a>
-</span><span id="UISRNN.fit_concatenated-238"><a href="#UISRNN.fit_concatenated-238"><span class="linenos">238</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-239"><a href="#UISRNN.fit_concatenated-239"><span class="linenos">239</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-240"><a href="#UISRNN.fit_concatenated-240"><span class="linenos">240</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-241"><a href="#UISRNN.fit_concatenated-241"><span class="linenos">241</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-242"><a href="#UISRNN.fit_concatenated-242"><span class="linenos">242</span></a>
-</span><span id="UISRNN.fit_concatenated-243"><a href="#UISRNN.fit_concatenated-243"><span class="linenos">243</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
-</span><span id="UISRNN.fit_concatenated-244"><a href="#UISRNN.fit_concatenated-244"><span class="linenos">244</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-245"><a href="#UISRNN.fit_concatenated-245"><span class="linenos">245</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-246"><a href="#UISRNN.fit_concatenated-246"><span class="linenos">246</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-247"><a href="#UISRNN.fit_concatenated-247"><span class="linenos">247</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-248"><a href="#UISRNN.fit_concatenated-248"><span class="linenos">248</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-249"><a href="#UISRNN.fit_concatenated-249"><span class="linenos">249</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-250"><a href="#UISRNN.fit_concatenated-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-251"><a href="#UISRNN.fit_concatenated-251"><span class="linenos">251</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN.fit_concatenated-252"><a href="#UISRNN.fit_concatenated-252"><span class="linenos">252</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-253"><a href="#UISRNN.fit_concatenated-253"><span class="linenos">253</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-254"><a href="#UISRNN.fit_concatenated-254"><span class="linenos">254</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
-</span><span id="UISRNN.fit_concatenated-255"><a href="#UISRNN.fit_concatenated-255"><span class="linenos">255</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-256"><a href="#UISRNN.fit_concatenated-256"><span class="linenos">256</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-257"><a href="#UISRNN.fit_concatenated-257"><span class="linenos">257</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-258"><a href="#UISRNN.fit_concatenated-258"><span class="linenos">258</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-259"><a href="#UISRNN.fit_concatenated-259"><span class="linenos">259</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-260"><a href="#UISRNN.fit_concatenated-260"><span class="linenos">260</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-261"><a href="#UISRNN.fit_concatenated-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-262"><a href="#UISRNN.fit_concatenated-262"><span class="linenos">262</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-263"><a href="#UISRNN.fit_concatenated-263"><span class="linenos">263</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-264"><a href="#UISRNN.fit_concatenated-264"><span class="linenos">264</span></a>      <span class="c1"># use mean to predict</span>
-</span><span id="UISRNN.fit_concatenated-265"><a href="#UISRNN.fit_concatenated-265"><span class="linenos">265</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-266"><a href="#UISRNN.fit_concatenated-266"><span class="linenos">266</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-267"><a href="#UISRNN.fit_concatenated-267"><span class="linenos">267</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-268"><a href="#UISRNN.fit_concatenated-268"><span class="linenos">268</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-269"><a href="#UISRNN.fit_concatenated-269"><span class="linenos">269</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
-</span><span id="UISRNN.fit_concatenated-270"><a href="#UISRNN.fit_concatenated-270"><span class="linenos">270</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN.fit_concatenated-271"><a href="#UISRNN.fit_concatenated-271"><span class="linenos">271</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-272"><a href="#UISRNN.fit_concatenated-272"><span class="linenos">272</span></a>
-</span><span id="UISRNN.fit_concatenated-273"><a href="#UISRNN.fit_concatenated-273"><span class="linenos">273</span></a>      <span class="c1"># Likelihood part.</span>
-</span><span id="UISRNN.fit_concatenated-274"><a href="#UISRNN.fit_concatenated-274"><span class="linenos">274</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-275"><a href="#UISRNN.fit_concatenated-275"><span class="linenos">275</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
-</span><span id="UISRNN.fit_concatenated-276"><a href="#UISRNN.fit_concatenated-276"><span class="linenos">276</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-277"><a href="#UISRNN.fit_concatenated-277"><span class="linenos">277</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
-</span><span id="UISRNN.fit_concatenated-278"><a href="#UISRNN.fit_concatenated-278"><span class="linenos">278</span></a>
-</span><span id="UISRNN.fit_concatenated-279"><a href="#UISRNN.fit_concatenated-279"><span class="linenos">279</span></a>      <span class="c1"># Sigma2 prior part.</span>
-</span><span id="UISRNN.fit_concatenated-280"><a href="#UISRNN.fit_concatenated-280"><span class="linenos">280</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-281"><a href="#UISRNN.fit_concatenated-281"><span class="linenos">281</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-282"><a href="#UISRNN.fit_concatenated-282"><span class="linenos">282</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-283"><a href="#UISRNN.fit_concatenated-283"><span class="linenos">283</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-284"><a href="#UISRNN.fit_concatenated-284"><span class="linenos">284</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-285"><a href="#UISRNN.fit_concatenated-285"><span class="linenos">285</span></a>
-</span><span id="UISRNN.fit_concatenated-286"><a href="#UISRNN.fit_concatenated-286"><span class="linenos">286</span></a>      <span class="c1"># Regularization part.</span>
-</span><span id="UISRNN.fit_concatenated-287"><a href="#UISRNN.fit_concatenated-287"><span class="linenos">287</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-288"><a href="#UISRNN.fit_concatenated-288"><span class="linenos">288</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-289"><a href="#UISRNN.fit_concatenated-289"><span class="linenos">289</span></a>
-</span><span id="UISRNN.fit_concatenated-290"><a href="#UISRNN.fit_concatenated-290"><span class="linenos">290</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
-</span><span id="UISRNN.fit_concatenated-291"><a href="#UISRNN.fit_concatenated-291"><span class="linenos">291</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-292"><a href="#UISRNN.fit_concatenated-292"><span class="linenos">292</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-293"><a href="#UISRNN.fit_concatenated-293"><span class="linenos">293</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-294"><a href="#UISRNN.fit_concatenated-294"><span class="linenos">294</span></a>      <span class="c1"># avoid numerical issues</span>
-</span><span id="UISRNN.fit_concatenated-295"><a href="#UISRNN.fit_concatenated-295"><span class="linenos">295</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-296"><a href="#UISRNN.fit_concatenated-296"><span class="linenos">296</span></a>
-</span><span id="UISRNN.fit_concatenated-297"><a href="#UISRNN.fit_concatenated-297"><span class="linenos">297</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
-</span><span id="UISRNN.fit_concatenated-298"><a href="#UISRNN.fit_concatenated-298"><span class="linenos">298</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-299"><a href="#UISRNN.fit_concatenated-299"><span class="linenos">299</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-300"><a href="#UISRNN.fit_concatenated-300"><span class="linenos">300</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-301"><a href="#UISRNN.fit_concatenated-301"><span class="linenos">301</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-302"><a href="#UISRNN.fit_concatenated-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-303"><a href="#UISRNN.fit_concatenated-303"><span class="linenos">303</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-304"><a href="#UISRNN.fit_concatenated-304"><span class="linenos">304</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-305"><a href="#UISRNN.fit_concatenated-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-306"><a href="#UISRNN.fit_concatenated-306"><span class="linenos">306</span></a>                <span class="n">num_iter</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-307"><a href="#UISRNN.fit_concatenated-307"><span class="linenos">307</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN.fit_concatenated-308"><a href="#UISRNN.fit_concatenated-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN.fit_concatenated-309"><a href="#UISRNN.fit_concatenated-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN.fit_concatenated-310"><a href="#UISRNN.fit_concatenated-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
-</span><span id="UISRNN.fit_concatenated-311"><a href="#UISRNN.fit_concatenated-311"><span class="linenos">311</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
-</span><span id="UISRNN.fit_concatenated-312"><a href="#UISRNN.fit_concatenated-312"><span class="linenos">312</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-313"><a href="#UISRNN.fit_concatenated-313"><span class="linenos">313</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit_concatenated-173"><a href="#UISRNN.fit_concatenated-173"><span class="linenos">173</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-174"><a href="#UISRNN.fit_concatenated-174"><span class="linenos">174</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
+</span><span id="UISRNN.fit_concatenated-175"><a href="#UISRNN.fit_concatenated-175"><span class="linenos">175</span></a>
+</span><span id="UISRNN.fit_concatenated-176"><a href="#UISRNN.fit_concatenated-176"><span class="linenos">176</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.fit_concatenated-177"><a href="#UISRNN.fit_concatenated-177"><span class="linenos">177</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
+</span><span id="UISRNN.fit_concatenated-178"><a href="#UISRNN.fit_concatenated-178"><span class="linenos">178</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN.fit_concatenated-179"><a href="#UISRNN.fit_concatenated-179"><span class="linenos">179</span></a>
+</span><span id="UISRNN.fit_concatenated-180"><a href="#UISRNN.fit_concatenated-180"><span class="linenos">180</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
+</span><span id="UISRNN.fit_concatenated-181"><a href="#UISRNN.fit_concatenated-181"><span class="linenos">181</span></a><span class="sd">        - `D`: observation dimension.</span>
+</span><span id="UISRNN.fit_concatenated-182"><a href="#UISRNN.fit_concatenated-182"><span class="linenos">182</span></a>
+</span><span id="UISRNN.fit_concatenated-183"><a href="#UISRNN.fit_concatenated-183"><span class="linenos">183</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN.fit_concatenated-184"><a href="#UISRNN.fit_concatenated-184"><span class="linenos">184</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-185"><a href="#UISRNN.fit_concatenated-185"><span class="linenos">185</span></a><span class="sd">      train_sequence =</span>
+</span><span id="UISRNN.fit_concatenated-186"><a href="#UISRNN.fit_concatenated-186"><span class="linenos">186</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN.fit_concatenated-187"><a href="#UISRNN.fit_concatenated-187"><span class="linenos">187</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN.fit_concatenated-188"><a href="#UISRNN.fit_concatenated-188"><span class="linenos">188</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN.fit_concatenated-189"><a href="#UISRNN.fit_concatenated-189"><span class="linenos">189</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN.fit_concatenated-190"><a href="#UISRNN.fit_concatenated-190"><span class="linenos">190</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN.fit_concatenated-191"><a href="#UISRNN.fit_concatenated-191"><span class="linenos">191</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-192"><a href="#UISRNN.fit_concatenated-192"><span class="linenos">192</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN.fit_concatenated-193"><a href="#UISRNN.fit_concatenated-193"><span class="linenos">193</span></a>
+</span><span id="UISRNN.fit_concatenated-194"><a href="#UISRNN.fit_concatenated-194"><span class="linenos">194</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
+</span><span id="UISRNN.fit_concatenated-195"><a href="#UISRNN.fit_concatenated-195"><span class="linenos">195</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
+</span><span id="UISRNN.fit_concatenated-196"><a href="#UISRNN.fit_concatenated-196"><span class="linenos">196</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
+</span><span id="UISRNN.fit_concatenated-197"><a href="#UISRNN.fit_concatenated-197"><span class="linenos">197</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN.fit_concatenated-198"><a href="#UISRNN.fit_concatenated-198"><span class="linenos">198</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-199"><a href="#UISRNN.fit_concatenated-199"><span class="linenos">199</span></a><span class="sd">      train_cluster_id =</span>
+</span><span id="UISRNN.fit_concatenated-200"><a href="#UISRNN.fit_concatenated-200"><span class="linenos">200</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
+</span><span id="UISRNN.fit_concatenated-201"><a href="#UISRNN.fit_concatenated-201"><span class="linenos">201</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-202"><a href="#UISRNN.fit_concatenated-202"><span class="linenos">202</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
+</span><span id="UISRNN.fit_concatenated-203"><a href="#UISRNN.fit_concatenated-203"><span class="linenos">203</span></a>
+</span><span id="UISRNN.fit_concatenated-204"><a href="#UISRNN.fit_concatenated-204"><span class="linenos">204</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
+</span><span id="UISRNN.fit_concatenated-205"><a href="#UISRNN.fit_concatenated-205"><span class="linenos">205</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
+</span><span id="UISRNN.fit_concatenated-206"><a href="#UISRNN.fit_concatenated-206"><span class="linenos">206</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.fit_concatenated-207"><a href="#UISRNN.fit_concatenated-207"><span class="linenos">207</span></a>
+</span><span id="UISRNN.fit_concatenated-208"><a href="#UISRNN.fit_concatenated-208"><span class="linenos">208</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.fit_concatenated-209"><a href="#UISRNN.fit_concatenated-209"><span class="linenos">209</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
+</span><span id="UISRNN.fit_concatenated-210"><a href="#UISRNN.fit_concatenated-210"><span class="linenos">210</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
+</span><span id="UISRNN.fit_concatenated-211"><a href="#UISRNN.fit_concatenated-211"><span class="linenos">211</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.fit_concatenated-212"><a href="#UISRNN.fit_concatenated-212"><span class="linenos">212</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN.fit_concatenated-213"><a href="#UISRNN.fit_concatenated-213"><span class="linenos">213</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN.fit_concatenated-214"><a href="#UISRNN.fit_concatenated-214"><span class="linenos">214</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-215"><a href="#UISRNN.fit_concatenated-215"><span class="linenos">215</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-216"><a href="#UISRNN.fit_concatenated-216"><span class="linenos">216</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-217"><a href="#UISRNN.fit_concatenated-217"><span class="linenos">217</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-218"><a href="#UISRNN.fit_concatenated-218"><span class="linenos">218</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN.fit_concatenated-219"><a href="#UISRNN.fit_concatenated-219"><span class="linenos">219</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
+</span><span id="UISRNN.fit_concatenated-220"><a href="#UISRNN.fit_concatenated-220"><span class="linenos">220</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-221"><a href="#UISRNN.fit_concatenated-221"><span class="linenos">221</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN.fit_concatenated-222"><a href="#UISRNN.fit_concatenated-222"><span class="linenos">222</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-223"><a href="#UISRNN.fit_concatenated-223"><span class="linenos">223</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-224"><a href="#UISRNN.fit_concatenated-224"><span class="linenos">224</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-225"><a href="#UISRNN.fit_concatenated-225"><span class="linenos">225</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-226"><a href="#UISRNN.fit_concatenated-226"><span class="linenos">226</span></a>    <span class="c1"># check length and size</span>
+</span><span id="UISRNN.fit_concatenated-227"><a href="#UISRNN.fit_concatenated-227"><span class="linenos">227</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN.fit_concatenated-228"><a href="#UISRNN.fit_concatenated-228"><span class="linenos">228</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-229"><a href="#UISRNN.fit_concatenated-229"><span class="linenos">229</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN.fit_concatenated-230"><a href="#UISRNN.fit_concatenated-230"><span class="linenos">230</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-231"><a href="#UISRNN.fit_concatenated-231"><span class="linenos">231</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-232"><a href="#UISRNN.fit_concatenated-232"><span class="linenos">232</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
+</span><span id="UISRNN.fit_concatenated-233"><a href="#UISRNN.fit_concatenated-233"><span class="linenos">233</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-234"><a href="#UISRNN.fit_concatenated-234"><span class="linenos">234</span></a>
+</span><span id="UISRNN.fit_concatenated-235"><a href="#UISRNN.fit_concatenated-235"><span class="linenos">235</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-236"><a href="#UISRNN.fit_concatenated-236"><span class="linenos">236</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-237"><a href="#UISRNN.fit_concatenated-237"><span class="linenos">237</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-238"><a href="#UISRNN.fit_concatenated-238"><span class="linenos">238</span></a>
+</span><span id="UISRNN.fit_concatenated-239"><a href="#UISRNN.fit_concatenated-239"><span class="linenos">239</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-240"><a href="#UISRNN.fit_concatenated-240"><span class="linenos">240</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-241"><a href="#UISRNN.fit_concatenated-241"><span class="linenos">241</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-242"><a href="#UISRNN.fit_concatenated-242"><span class="linenos">242</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-243"><a href="#UISRNN.fit_concatenated-243"><span class="linenos">243</span></a>
+</span><span id="UISRNN.fit_concatenated-244"><a href="#UISRNN.fit_concatenated-244"><span class="linenos">244</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
+</span><span id="UISRNN.fit_concatenated-245"><a href="#UISRNN.fit_concatenated-245"><span class="linenos">245</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-246"><a href="#UISRNN.fit_concatenated-246"><span class="linenos">246</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-247"><a href="#UISRNN.fit_concatenated-247"><span class="linenos">247</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-248"><a href="#UISRNN.fit_concatenated-248"><span class="linenos">248</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-249"><a href="#UISRNN.fit_concatenated-249"><span class="linenos">249</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-250"><a href="#UISRNN.fit_concatenated-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-251"><a href="#UISRNN.fit_concatenated-251"><span class="linenos">251</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-252"><a href="#UISRNN.fit_concatenated-252"><span class="linenos">252</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN.fit_concatenated-253"><a href="#UISRNN.fit_concatenated-253"><span class="linenos">253</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-254"><a href="#UISRNN.fit_concatenated-254"><span class="linenos">254</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-255"><a href="#UISRNN.fit_concatenated-255"><span class="linenos">255</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
+</span><span id="UISRNN.fit_concatenated-256"><a href="#UISRNN.fit_concatenated-256"><span class="linenos">256</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-257"><a href="#UISRNN.fit_concatenated-257"><span class="linenos">257</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-258"><a href="#UISRNN.fit_concatenated-258"><span class="linenos">258</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-259"><a href="#UISRNN.fit_concatenated-259"><span class="linenos">259</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-260"><a href="#UISRNN.fit_concatenated-260"><span class="linenos">260</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-261"><a href="#UISRNN.fit_concatenated-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-262"><a href="#UISRNN.fit_concatenated-262"><span class="linenos">262</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-263"><a href="#UISRNN.fit_concatenated-263"><span class="linenos">263</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-264"><a href="#UISRNN.fit_concatenated-264"><span class="linenos">264</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-265"><a href="#UISRNN.fit_concatenated-265"><span class="linenos">265</span></a>      <span class="c1"># use mean to predict</span>
+</span><span id="UISRNN.fit_concatenated-266"><a href="#UISRNN.fit_concatenated-266"><span class="linenos">266</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-267"><a href="#UISRNN.fit_concatenated-267"><span class="linenos">267</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-268"><a href="#UISRNN.fit_concatenated-268"><span class="linenos">268</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-269"><a href="#UISRNN.fit_concatenated-269"><span class="linenos">269</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-270"><a href="#UISRNN.fit_concatenated-270"><span class="linenos">270</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
+</span><span id="UISRNN.fit_concatenated-271"><a href="#UISRNN.fit_concatenated-271"><span class="linenos">271</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN.fit_concatenated-272"><a href="#UISRNN.fit_concatenated-272"><span class="linenos">272</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-273"><a href="#UISRNN.fit_concatenated-273"><span class="linenos">273</span></a>
+</span><span id="UISRNN.fit_concatenated-274"><a href="#UISRNN.fit_concatenated-274"><span class="linenos">274</span></a>      <span class="c1"># Likelihood part.</span>
+</span><span id="UISRNN.fit_concatenated-275"><a href="#UISRNN.fit_concatenated-275"><span class="linenos">275</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-276"><a href="#UISRNN.fit_concatenated-276"><span class="linenos">276</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
+</span><span id="UISRNN.fit_concatenated-277"><a href="#UISRNN.fit_concatenated-277"><span class="linenos">277</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-278"><a href="#UISRNN.fit_concatenated-278"><span class="linenos">278</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
+</span><span id="UISRNN.fit_concatenated-279"><a href="#UISRNN.fit_concatenated-279"><span class="linenos">279</span></a>
+</span><span id="UISRNN.fit_concatenated-280"><a href="#UISRNN.fit_concatenated-280"><span class="linenos">280</span></a>      <span class="c1"># Sigma2 prior part.</span>
+</span><span id="UISRNN.fit_concatenated-281"><a href="#UISRNN.fit_concatenated-281"><span class="linenos">281</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-282"><a href="#UISRNN.fit_concatenated-282"><span class="linenos">282</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-283"><a href="#UISRNN.fit_concatenated-283"><span class="linenos">283</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-284"><a href="#UISRNN.fit_concatenated-284"><span class="linenos">284</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-285"><a href="#UISRNN.fit_concatenated-285"><span class="linenos">285</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-286"><a href="#UISRNN.fit_concatenated-286"><span class="linenos">286</span></a>
+</span><span id="UISRNN.fit_concatenated-287"><a href="#UISRNN.fit_concatenated-287"><span class="linenos">287</span></a>      <span class="c1"># Regularization part.</span>
+</span><span id="UISRNN.fit_concatenated-288"><a href="#UISRNN.fit_concatenated-288"><span class="linenos">288</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-289"><a href="#UISRNN.fit_concatenated-289"><span class="linenos">289</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-290"><a href="#UISRNN.fit_concatenated-290"><span class="linenos">290</span></a>
+</span><span id="UISRNN.fit_concatenated-291"><a href="#UISRNN.fit_concatenated-291"><span class="linenos">291</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
+</span><span id="UISRNN.fit_concatenated-292"><a href="#UISRNN.fit_concatenated-292"><span class="linenos">292</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-293"><a href="#UISRNN.fit_concatenated-293"><span class="linenos">293</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-294"><a href="#UISRNN.fit_concatenated-294"><span class="linenos">294</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-295"><a href="#UISRNN.fit_concatenated-295"><span class="linenos">295</span></a>      <span class="c1"># avoid numerical issues</span>
+</span><span id="UISRNN.fit_concatenated-296"><a href="#UISRNN.fit_concatenated-296"><span class="linenos">296</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-297"><a href="#UISRNN.fit_concatenated-297"><span class="linenos">297</span></a>
+</span><span id="UISRNN.fit_concatenated-298"><a href="#UISRNN.fit_concatenated-298"><span class="linenos">298</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
+</span><span id="UISRNN.fit_concatenated-299"><a href="#UISRNN.fit_concatenated-299"><span class="linenos">299</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-300"><a href="#UISRNN.fit_concatenated-300"><span class="linenos">300</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-301"><a href="#UISRNN.fit_concatenated-301"><span class="linenos">301</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-302"><a href="#UISRNN.fit_concatenated-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-303"><a href="#UISRNN.fit_concatenated-303"><span class="linenos">303</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-304"><a href="#UISRNN.fit_concatenated-304"><span class="linenos">304</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-305"><a href="#UISRNN.fit_concatenated-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-306"><a href="#UISRNN.fit_concatenated-306"><span class="linenos">306</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-307"><a href="#UISRNN.fit_concatenated-307"><span class="linenos">307</span></a>                <span class="n">num_iter</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-308"><a href="#UISRNN.fit_concatenated-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN.fit_concatenated-309"><a href="#UISRNN.fit_concatenated-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN.fit_concatenated-310"><a href="#UISRNN.fit_concatenated-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN.fit_concatenated-311"><a href="#UISRNN.fit_concatenated-311"><span class="linenos">311</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
+</span><span id="UISRNN.fit_concatenated-312"><a href="#UISRNN.fit_concatenated-312"><span class="linenos">312</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
+</span><span id="UISRNN.fit_concatenated-313"><a href="#UISRNN.fit_concatenated-313"><span class="linenos">313</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-314"><a href="#UISRNN.fit_concatenated-314"><span class="linenos">314</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
 </span></pre></div>
 
 
@@ -1434,22 +1432,25 @@ <h1 class="modulename">
  [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance 'iaaa'
  [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance 'iaaa'
  [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance 'ibbb'
- [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'</p>
+ [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'
+</code></pre></p>
 
+<pre><code>Here `N=5`, `D=4`.
+
+We concatenate all training utterances into this single sequence.
 </code></pre>
-    Here `N=5`, `D=4`.
-<pre><code>We concatenate all training utterances into this single sequence.
 
-<p></code></pre>
-  train_cluster_id: the speaker id sequence, which is 1-dim list or
+<p>train_cluster_id: the speaker id sequence, which is 1-dim list or
     numpy array of strings, of size <code>N</code>.
-    For example,
-  <pre><code>train_cluster_id =
+    For example,</p>
+
+<p><pre><code>train_cluster_id =
   ['iaaa_0', 'iaaa_1', 'iaaa_0', 'ibbb_0', 'ibbb_0']
-</code></pre>
-    'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.</p>
+</code></pre></p>
+
+<pre><code>'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.
 
-<pre><code>Note that the order of entries within an utterance are preserved,
+Note that the order of entries within an utterance are preserved,
 and all utterances are simply concatenated together.
 </code></pre>
 
@@ -1473,78 +1474,78 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN.fit"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit-315"><a href="#UISRNN.fit-315"><span class="linenos">315</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.fit-316"><a href="#UISRNN.fit-316"><span class="linenos">316</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
-</span><span id="UISRNN.fit-317"><a href="#UISRNN.fit-317"><span class="linenos">317</span></a>
-</span><span id="UISRNN.fit-318"><a href="#UISRNN.fit-318"><span class="linenos">318</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.fit-319"><a href="#UISRNN.fit-319"><span class="linenos">319</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
-</span><span id="UISRNN.fit-320"><a href="#UISRNN.fit-320"><span class="linenos">320</span></a><span class="sd">        concatenated training sequence:</span>
-</span><span id="UISRNN.fit-321"><a href="#UISRNN.fit-321"><span class="linenos">321</span></a>
-</span><span id="UISRNN.fit-322"><a href="#UISRNN.fit-322"><span class="linenos">322</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
-</span><span id="UISRNN.fit-323"><a href="#UISRNN.fit-323"><span class="linenos">323</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
-</span><span id="UISRNN.fit-324"><a href="#UISRNN.fit-324"><span class="linenos">324</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
-</span><span id="UISRNN.fit-325"><a href="#UISRNN.fit-325"><span class="linenos">325</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
-</span><span id="UISRNN.fit-326"><a href="#UISRNN.fit-326"><span class="linenos">326</span></a><span class="sd">           embeddings of one utterance.</span>
-</span><span id="UISRNN.fit-327"><a href="#UISRNN.fit-327"><span class="linenos">327</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
-</span><span id="UISRNN.fit-328"><a href="#UISRNN.fit-328"><span class="linenos">328</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
-</span><span id="UISRNN.fit-329"><a href="#UISRNN.fit-329"><span class="linenos">329</span></a><span class="sd">           for more details.</span>
-</span><span id="UISRNN.fit-330"><a href="#UISRNN.fit-330"><span class="linenos">330</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
-</span><span id="UISRNN.fit-331"><a href="#UISRNN.fit-331"><span class="linenos">331</span></a>
-</span><span id="UISRNN.fit-332"><a href="#UISRNN.fit-332"><span class="linenos">332</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
-</span><span id="UISRNN.fit-333"><a href="#UISRNN.fit-333"><span class="linenos">333</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
-</span><span id="UISRNN.fit-334"><a href="#UISRNN.fit-334"><span class="linenos">334</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
-</span><span id="UISRNN.fit-335"><a href="#UISRNN.fit-335"><span class="linenos">335</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
-</span><span id="UISRNN.fit-336"><a href="#UISRNN.fit-336"><span class="linenos">336</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.fit-337"><a href="#UISRNN.fit-337"><span class="linenos">337</span></a>
-</span><span id="UISRNN.fit-338"><a href="#UISRNN.fit-338"><span class="linenos">338</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.fit-339"><a href="#UISRNN.fit-339"><span class="linenos">339</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
-</span><span id="UISRNN.fit-340"><a href="#UISRNN.fit-340"><span class="linenos">340</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.fit-341"><a href="#UISRNN.fit-341"><span class="linenos">341</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN.fit-342"><a href="#UISRNN.fit-342"><span class="linenos">342</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
-</span><span id="UISRNN.fit-343"><a href="#UISRNN.fit-343"><span class="linenos">343</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN.fit-344"><a href="#UISRNN.fit-344"><span class="linenos">344</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
-</span><span id="UISRNN.fit-345"><a href="#UISRNN.fit-345"><span class="linenos">345</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.fit-346"><a href="#UISRNN.fit-346"><span class="linenos">346</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN.fit-347"><a href="#UISRNN.fit-347"><span class="linenos">347</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
-</span><span id="UISRNN.fit-348"><a href="#UISRNN.fit-348"><span class="linenos">348</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
-</span><span id="UISRNN.fit-349"><a href="#UISRNN.fit-349"><span class="linenos">349</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
-</span><span id="UISRNN.fit-350"><a href="#UISRNN.fit-350"><span class="linenos">350</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
-</span><span id="UISRNN.fit-351"><a href="#UISRNN.fit-351"><span class="linenos">351</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit-352"><a href="#UISRNN.fit-352"><span class="linenos">352</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
-</span><span id="UISRNN.fit-353"><a href="#UISRNN.fit-353"><span class="linenos">353</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
-</span><span id="UISRNN.fit-354"><a href="#UISRNN.fit-354"><span class="linenos">354</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN.fit-355"><a href="#UISRNN.fit-355"><span class="linenos">355</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
-</span><span id="UISRNN.fit-356"><a href="#UISRNN.fit-356"><span class="linenos">356</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
-</span><span id="UISRNN.fit-357"><a href="#UISRNN.fit-357"><span class="linenos">357</span></a>      <span class="k">pass</span>
-</span><span id="UISRNN.fit-358"><a href="#UISRNN.fit-358"><span class="linenos">358</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN.fit-359"><a href="#UISRNN.fit-359"><span class="linenos">359</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit-360"><a href="#UISRNN.fit-360"><span class="linenos">360</span></a>
-</span><span id="UISRNN.fit-361"><a href="#UISRNN.fit-361"><span class="linenos">361</span></a>    <span class="c1"># estimate transition_bias</span>
-</span><span id="UISRNN.fit-362"><a href="#UISRNN.fit-362"><span class="linenos">362</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN.fit-363"><a href="#UISRNN.fit-363"><span class="linenos">363</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN.fit-364"><a href="#UISRNN.fit-364"><span class="linenos">364</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
-</span><span id="UISRNN.fit-365"><a href="#UISRNN.fit-365"><span class="linenos">365</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
-</span><span id="UISRNN.fit-366"><a href="#UISRNN.fit-366"><span class="linenos">366</span></a>      <span class="c1"># set or update transition_bias</span>
-</span><span id="UISRNN.fit-367"><a href="#UISRNN.fit-367"><span class="linenos">367</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN.fit-368"><a href="#UISRNN.fit-368"><span class="linenos">368</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
-</span><span id="UISRNN.fit-369"><a href="#UISRNN.fit-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN.fit-370"><a href="#UISRNN.fit-370"><span class="linenos">370</span></a>      <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN.fit-371"><a href="#UISRNN.fit-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="UISRNN.fit-372"><a href="#UISRNN.fit-372"><span class="linenos">372</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
-</span><span id="UISRNN.fit-373"><a href="#UISRNN.fit-373"><span class="linenos">373</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="UISRNN.fit-374"><a href="#UISRNN.fit-374"><span class="linenos">374</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
-</span><span id="UISRNN.fit-375"><a href="#UISRNN.fit-375"><span class="linenos">375</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN.fit-376"><a href="#UISRNN.fit-376"><span class="linenos">376</span></a>
-</span><span id="UISRNN.fit-377"><a href="#UISRNN.fit-377"><span class="linenos">377</span></a>    <span class="c1"># concatenate train_sequences</span>
-</span><span id="UISRNN.fit-378"><a href="#UISRNN.fit-378"><span class="linenos">378</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN.fit-379"><a href="#UISRNN.fit-379"><span class="linenos">379</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
-</span><span id="UISRNN.fit-380"><a href="#UISRNN.fit-380"><span class="linenos">380</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
-</span><span id="UISRNN.fit-381"><a href="#UISRNN.fit-381"><span class="linenos">381</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
-</span><span id="UISRNN.fit-382"><a href="#UISRNN.fit-382"><span class="linenos">382</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
-</span><span id="UISRNN.fit-383"><a href="#UISRNN.fit-383"><span class="linenos">383</span></a>         <span class="kc">True</span><span class="p">)</span>
-</span><span id="UISRNN.fit-384"><a href="#UISRNN.fit-384"><span class="linenos">384</span></a>
-</span><span id="UISRNN.fit-385"><a href="#UISRNN.fit-385"><span class="linenos">385</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
-</span><span id="UISRNN.fit-386"><a href="#UISRNN.fit-386"><span class="linenos">386</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit-316"><a href="#UISRNN.fit-316"><span class="linenos">316</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.fit-317"><a href="#UISRNN.fit-317"><span class="linenos">317</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
+</span><span id="UISRNN.fit-318"><a href="#UISRNN.fit-318"><span class="linenos">318</span></a>
+</span><span id="UISRNN.fit-319"><a href="#UISRNN.fit-319"><span class="linenos">319</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.fit-320"><a href="#UISRNN.fit-320"><span class="linenos">320</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
+</span><span id="UISRNN.fit-321"><a href="#UISRNN.fit-321"><span class="linenos">321</span></a><span class="sd">        concatenated training sequence:</span>
+</span><span id="UISRNN.fit-322"><a href="#UISRNN.fit-322"><span class="linenos">322</span></a>
+</span><span id="UISRNN.fit-323"><a href="#UISRNN.fit-323"><span class="linenos">323</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
+</span><span id="UISRNN.fit-324"><a href="#UISRNN.fit-324"><span class="linenos">324</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
+</span><span id="UISRNN.fit-325"><a href="#UISRNN.fit-325"><span class="linenos">325</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
+</span><span id="UISRNN.fit-326"><a href="#UISRNN.fit-326"><span class="linenos">326</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
+</span><span id="UISRNN.fit-327"><a href="#UISRNN.fit-327"><span class="linenos">327</span></a><span class="sd">           embeddings of one utterance.</span>
+</span><span id="UISRNN.fit-328"><a href="#UISRNN.fit-328"><span class="linenos">328</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
+</span><span id="UISRNN.fit-329"><a href="#UISRNN.fit-329"><span class="linenos">329</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
+</span><span id="UISRNN.fit-330"><a href="#UISRNN.fit-330"><span class="linenos">330</span></a><span class="sd">           for more details.</span>
+</span><span id="UISRNN.fit-331"><a href="#UISRNN.fit-331"><span class="linenos">331</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
+</span><span id="UISRNN.fit-332"><a href="#UISRNN.fit-332"><span class="linenos">332</span></a>
+</span><span id="UISRNN.fit-333"><a href="#UISRNN.fit-333"><span class="linenos">333</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
+</span><span id="UISRNN.fit-334"><a href="#UISRNN.fit-334"><span class="linenos">334</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
+</span><span id="UISRNN.fit-335"><a href="#UISRNN.fit-335"><span class="linenos">335</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
+</span><span id="UISRNN.fit-336"><a href="#UISRNN.fit-336"><span class="linenos">336</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
+</span><span id="UISRNN.fit-337"><a href="#UISRNN.fit-337"><span class="linenos">337</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.fit-338"><a href="#UISRNN.fit-338"><span class="linenos">338</span></a>
+</span><span id="UISRNN.fit-339"><a href="#UISRNN.fit-339"><span class="linenos">339</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.fit-340"><a href="#UISRNN.fit-340"><span class="linenos">340</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
+</span><span id="UISRNN.fit-341"><a href="#UISRNN.fit-341"><span class="linenos">341</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.fit-342"><a href="#UISRNN.fit-342"><span class="linenos">342</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN.fit-343"><a href="#UISRNN.fit-343"><span class="linenos">343</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
+</span><span id="UISRNN.fit-344"><a href="#UISRNN.fit-344"><span class="linenos">344</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN.fit-345"><a href="#UISRNN.fit-345"><span class="linenos">345</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
+</span><span id="UISRNN.fit-346"><a href="#UISRNN.fit-346"><span class="linenos">346</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.fit-347"><a href="#UISRNN.fit-347"><span class="linenos">347</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN.fit-348"><a href="#UISRNN.fit-348"><span class="linenos">348</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
+</span><span id="UISRNN.fit-349"><a href="#UISRNN.fit-349"><span class="linenos">349</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
+</span><span id="UISRNN.fit-350"><a href="#UISRNN.fit-350"><span class="linenos">350</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
+</span><span id="UISRNN.fit-351"><a href="#UISRNN.fit-351"><span class="linenos">351</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
+</span><span id="UISRNN.fit-352"><a href="#UISRNN.fit-352"><span class="linenos">352</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit-353"><a href="#UISRNN.fit-353"><span class="linenos">353</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
+</span><span id="UISRNN.fit-354"><a href="#UISRNN.fit-354"><span class="linenos">354</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
+</span><span id="UISRNN.fit-355"><a href="#UISRNN.fit-355"><span class="linenos">355</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN.fit-356"><a href="#UISRNN.fit-356"><span class="linenos">356</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
+</span><span id="UISRNN.fit-357"><a href="#UISRNN.fit-357"><span class="linenos">357</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
+</span><span id="UISRNN.fit-358"><a href="#UISRNN.fit-358"><span class="linenos">358</span></a>      <span class="k">pass</span>
+</span><span id="UISRNN.fit-359"><a href="#UISRNN.fit-359"><span class="linenos">359</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN.fit-360"><a href="#UISRNN.fit-360"><span class="linenos">360</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit-361"><a href="#UISRNN.fit-361"><span class="linenos">361</span></a>
+</span><span id="UISRNN.fit-362"><a href="#UISRNN.fit-362"><span class="linenos">362</span></a>    <span class="c1"># estimate transition_bias</span>
+</span><span id="UISRNN.fit-363"><a href="#UISRNN.fit-363"><span class="linenos">363</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN.fit-364"><a href="#UISRNN.fit-364"><span class="linenos">364</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN.fit-365"><a href="#UISRNN.fit-365"><span class="linenos">365</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
+</span><span id="UISRNN.fit-366"><a href="#UISRNN.fit-366"><span class="linenos">366</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
+</span><span id="UISRNN.fit-367"><a href="#UISRNN.fit-367"><span class="linenos">367</span></a>      <span class="c1"># set or update transition_bias</span>
+</span><span id="UISRNN.fit-368"><a href="#UISRNN.fit-368"><span class="linenos">368</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN.fit-369"><a href="#UISRNN.fit-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
+</span><span id="UISRNN.fit-370"><a href="#UISRNN.fit-370"><span class="linenos">370</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN.fit-371"><a href="#UISRNN.fit-371"><span class="linenos">371</span></a>      <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN.fit-372"><a href="#UISRNN.fit-372"><span class="linenos">372</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="UISRNN.fit-373"><a href="#UISRNN.fit-373"><span class="linenos">373</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
+</span><span id="UISRNN.fit-374"><a href="#UISRNN.fit-374"><span class="linenos">374</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="UISRNN.fit-375"><a href="#UISRNN.fit-375"><span class="linenos">375</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
+</span><span id="UISRNN.fit-376"><a href="#UISRNN.fit-376"><span class="linenos">376</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN.fit-377"><a href="#UISRNN.fit-377"><span class="linenos">377</span></a>
+</span><span id="UISRNN.fit-378"><a href="#UISRNN.fit-378"><span class="linenos">378</span></a>    <span class="c1"># concatenate train_sequences</span>
+</span><span id="UISRNN.fit-379"><a href="#UISRNN.fit-379"><span class="linenos">379</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN.fit-380"><a href="#UISRNN.fit-380"><span class="linenos">380</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
+</span><span id="UISRNN.fit-381"><a href="#UISRNN.fit-381"><span class="linenos">381</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
+</span><span id="UISRNN.fit-382"><a href="#UISRNN.fit-382"><span class="linenos">382</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
+</span><span id="UISRNN.fit-383"><a href="#UISRNN.fit-383"><span class="linenos">383</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
+</span><span id="UISRNN.fit-384"><a href="#UISRNN.fit-384"><span class="linenos">384</span></a>         <span class="kc">True</span><span class="p">)</span>
+</span><span id="UISRNN.fit-385"><a href="#UISRNN.fit-385"><span class="linenos">385</span></a>
+</span><span id="UISRNN.fit-386"><a href="#UISRNN.fit-386"><span class="linenos">386</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
+</span><span id="UISRNN.fit-387"><a href="#UISRNN.fit-387"><span class="linenos">387</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1591,90 +1592,90 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN.predict_single"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict_single-479"><a href="#UISRNN.predict_single-479"><span class="linenos">479</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-480"><a href="#UISRNN.predict_single-480"><span class="linenos">480</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
-</span><span id="UISRNN.predict_single-481"><a href="#UISRNN.predict_single-481"><span class="linenos">481</span></a>
-</span><span id="UISRNN.predict_single-482"><a href="#UISRNN.predict_single-482"><span class="linenos">482</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.predict_single-483"><a href="#UISRNN.predict_single-483"><span class="linenos">483</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
-</span><span id="UISRNN.predict_single-484"><a href="#UISRNN.predict_single-484"><span class="linenos">484</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN.predict_single-485"><a href="#UISRNN.predict_single-485"><span class="linenos">485</span></a>
-</span><span id="UISRNN.predict_single-486"><a href="#UISRNN.predict_single-486"><span class="linenos">486</span></a><span class="sd">        - `N`: length of one test utterance.</span>
-</span><span id="UISRNN.predict_single-487"><a href="#UISRNN.predict_single-487"><span class="linenos">487</span></a><span class="sd">        - `D` : observation dimension.</span>
-</span><span id="UISRNN.predict_single-488"><a href="#UISRNN.predict_single-488"><span class="linenos">488</span></a>
-</span><span id="UISRNN.predict_single-489"><a href="#UISRNN.predict_single-489"><span class="linenos">489</span></a><span class="sd">        For example:</span>
-</span><span id="UISRNN.predict_single-490"><a href="#UISRNN.predict_single-490"><span class="linenos">490</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.predict_single-491"><a href="#UISRNN.predict_single-491"><span class="linenos">491</span></a><span class="sd">      test_sequence =</span>
-</span><span id="UISRNN.predict_single-492"><a href="#UISRNN.predict_single-492"><span class="linenos">492</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-493"><a href="#UISRNN.predict_single-493"><span class="linenos">493</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-494"><a href="#UISRNN.predict_single-494"><span class="linenos">494</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-495"><a href="#UISRNN.predict_single-495"><span class="linenos">495</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-496"><a href="#UISRNN.predict_single-496"><span class="linenos">496</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-497"><a href="#UISRNN.predict_single-497"><span class="linenos">497</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.predict_single-498"><a href="#UISRNN.predict_single-498"><span class="linenos">498</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN.predict_single-499"><a href="#UISRNN.predict_single-499"><span class="linenos">499</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.predict_single-500"><a href="#UISRNN.predict_single-500"><span class="linenos">500</span></a>
-</span><span id="UISRNN.predict_single-501"><a href="#UISRNN.predict_single-501"><span class="linenos">501</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN.predict_single-502"><a href="#UISRNN.predict_single-502"><span class="linenos">502</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
-</span><span id="UISRNN.predict_single-503"><a href="#UISRNN.predict_single-503"><span class="linenos">503</span></a><span class="sd">        an array of integers, of size `N`.</span>
-</span><span id="UISRNN.predict_single-504"><a href="#UISRNN.predict_single-504"><span class="linenos">504</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
-</span><span id="UISRNN.predict_single-505"><a href="#UISRNN.predict_single-505"><span class="linenos">505</span></a>
-</span><span id="UISRNN.predict_single-506"><a href="#UISRNN.predict_single-506"><span class="linenos">506</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.predict_single-507"><a href="#UISRNN.predict_single-507"><span class="linenos">507</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
-</span><span id="UISRNN.predict_single-508"><a href="#UISRNN.predict_single-508"><span class="linenos">508</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
-</span><span id="UISRNN.predict_single-509"><a href="#UISRNN.predict_single-509"><span class="linenos">509</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.predict_single-510"><a href="#UISRNN.predict_single-510"><span class="linenos">510</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN.predict_single-511"><a href="#UISRNN.predict_single-511"><span class="linenos">511</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN.predict_single-512"><a href="#UISRNN.predict_single-512"><span class="linenos">512</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-513"><a href="#UISRNN.predict_single-513"><span class="linenos">513</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-514"><a href="#UISRNN.predict_single-514"><span class="linenos">514</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN.predict_single-515"><a href="#UISRNN.predict_single-515"><span class="linenos">515</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN.predict_single-516"><a href="#UISRNN.predict_single-516"><span class="linenos">516</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-517"><a href="#UISRNN.predict_single-517"><span class="linenos">517</span></a>    <span class="c1"># check size</span>
-</span><span id="UISRNN.predict_single-518"><a href="#UISRNN.predict_single-518"><span class="linenos">518</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN.predict_single-519"><a href="#UISRNN.predict_single-519"><span class="linenos">519</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN.predict_single-520"><a href="#UISRNN.predict_single-520"><span class="linenos">520</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN.predict_single-521"><a href="#UISRNN.predict_single-521"><span class="linenos">521</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-522"><a href="#UISRNN.predict_single-522"><span class="linenos">522</span></a>
-</span><span id="UISRNN.predict_single-523"><a href="#UISRNN.predict_single-523"><span class="linenos">523</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-</span><span id="UISRNN.predict_single-524"><a href="#UISRNN.predict_single-524"><span class="linenos">524</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN.predict_single-525"><a href="#UISRNN.predict_single-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-526"><a href="#UISRNN.predict_single-526"><span class="linenos">526</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-527"><a href="#UISRNN.predict_single-527"><span class="linenos">527</span></a>    <span class="c1"># bookkeeping for beam search</span>
-</span><span id="UISRNN.predict_single-528"><a href="#UISRNN.predict_single-528"><span class="linenos">528</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
-</span><span id="UISRNN.predict_single-529"><a href="#UISRNN.predict_single-529"><span class="linenos">529</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
-</span><span id="UISRNN.predict_single-530"><a href="#UISRNN.predict_single-530"><span class="linenos">530</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-531"><a href="#UISRNN.predict_single-531"><span class="linenos">531</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
-</span><span id="UISRNN.predict_single-532"><a href="#UISRNN.predict_single-532"><span class="linenos">532</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
-</span><span id="UISRNN.predict_single-533"><a href="#UISRNN.predict_single-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="UISRNN.predict_single-534"><a href="#UISRNN.predict_single-534"><span class="linenos">534</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-535"><a href="#UISRNN.predict_single-535"><span class="linenos">535</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-536"><a href="#UISRNN.predict_single-536"><span class="linenos">536</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-537"><a href="#UISRNN.predict_single-537"><span class="linenos">537</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
-</span><span id="UISRNN.predict_single-538"><a href="#UISRNN.predict_single-538"><span class="linenos">538</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-539"><a href="#UISRNN.predict_single-539"><span class="linenos">539</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-540"><a href="#UISRNN.predict_single-540"><span class="linenos">540</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-541"><a href="#UISRNN.predict_single-541"><span class="linenos">541</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
-</span><span id="UISRNN.predict_single-542"><a href="#UISRNN.predict_single-542"><span class="linenos">542</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
-</span><span id="UISRNN.predict_single-543"><a href="#UISRNN.predict_single-543"><span class="linenos">543</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
-</span><span id="UISRNN.predict_single-544"><a href="#UISRNN.predict_single-544"><span class="linenos">544</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
-</span><span id="UISRNN.predict_single-545"><a href="#UISRNN.predict_single-545"><span class="linenos">545</span></a>      <span class="c1"># find top scores</span>
-</span><span id="UISRNN.predict_single-546"><a href="#UISRNN.predict_single-546"><span class="linenos">546</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-547"><a href="#UISRNN.predict_single-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="UISRNN.predict_single-548"><a href="#UISRNN.predict_single-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-549"><a href="#UISRNN.predict_single-549"><span class="linenos">549</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-550"><a href="#UISRNN.predict_single-550"><span class="linenos">550</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN.predict_single-551"><a href="#UISRNN.predict_single-551"><span class="linenos">551</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-552"><a href="#UISRNN.predict_single-552"><span class="linenos">552</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
-</span><span id="UISRNN.predict_single-553"><a href="#UISRNN.predict_single-553"><span class="linenos">553</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
-</span><span id="UISRNN.predict_single-554"><a href="#UISRNN.predict_single-554"><span class="linenos">554</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-555"><a href="#UISRNN.predict_single-555"><span class="linenos">555</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
-</span><span id="UISRNN.predict_single-556"><a href="#UISRNN.predict_single-556"><span class="linenos">556</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="UISRNN.predict_single-557"><a href="#UISRNN.predict_single-557"><span class="linenos">557</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-558"><a href="#UISRNN.predict_single-558"><span class="linenos">558</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-559"><a href="#UISRNN.predict_single-559"><span class="linenos">559</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-560"><a href="#UISRNN.predict_single-560"><span class="linenos">560</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
-</span><span id="UISRNN.predict_single-561"><a href="#UISRNN.predict_single-561"><span class="linenos">561</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
-</span><span id="UISRNN.predict_single-562"><a href="#UISRNN.predict_single-562"><span class="linenos">562</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict_single-480"><a href="#UISRNN.predict_single-480"><span class="linenos">480</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-481"><a href="#UISRNN.predict_single-481"><span class="linenos">481</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
+</span><span id="UISRNN.predict_single-482"><a href="#UISRNN.predict_single-482"><span class="linenos">482</span></a>
+</span><span id="UISRNN.predict_single-483"><a href="#UISRNN.predict_single-483"><span class="linenos">483</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.predict_single-484"><a href="#UISRNN.predict_single-484"><span class="linenos">484</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
+</span><span id="UISRNN.predict_single-485"><a href="#UISRNN.predict_single-485"><span class="linenos">485</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN.predict_single-486"><a href="#UISRNN.predict_single-486"><span class="linenos">486</span></a>
+</span><span id="UISRNN.predict_single-487"><a href="#UISRNN.predict_single-487"><span class="linenos">487</span></a><span class="sd">        - `N`: length of one test utterance.</span>
+</span><span id="UISRNN.predict_single-488"><a href="#UISRNN.predict_single-488"><span class="linenos">488</span></a><span class="sd">        - `D` : observation dimension.</span>
+</span><span id="UISRNN.predict_single-489"><a href="#UISRNN.predict_single-489"><span class="linenos">489</span></a>
+</span><span id="UISRNN.predict_single-490"><a href="#UISRNN.predict_single-490"><span class="linenos">490</span></a><span class="sd">        For example:</span>
+</span><span id="UISRNN.predict_single-491"><a href="#UISRNN.predict_single-491"><span class="linenos">491</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.predict_single-492"><a href="#UISRNN.predict_single-492"><span class="linenos">492</span></a><span class="sd">      test_sequence =</span>
+</span><span id="UISRNN.predict_single-493"><a href="#UISRNN.predict_single-493"><span class="linenos">493</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-494"><a href="#UISRNN.predict_single-494"><span class="linenos">494</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-495"><a href="#UISRNN.predict_single-495"><span class="linenos">495</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-496"><a href="#UISRNN.predict_single-496"><span class="linenos">496</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-497"><a href="#UISRNN.predict_single-497"><span class="linenos">497</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-498"><a href="#UISRNN.predict_single-498"><span class="linenos">498</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.predict_single-499"><a href="#UISRNN.predict_single-499"><span class="linenos">499</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN.predict_single-500"><a href="#UISRNN.predict_single-500"><span class="linenos">500</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.predict_single-501"><a href="#UISRNN.predict_single-501"><span class="linenos">501</span></a>
+</span><span id="UISRNN.predict_single-502"><a href="#UISRNN.predict_single-502"><span class="linenos">502</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN.predict_single-503"><a href="#UISRNN.predict_single-503"><span class="linenos">503</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
+</span><span id="UISRNN.predict_single-504"><a href="#UISRNN.predict_single-504"><span class="linenos">504</span></a><span class="sd">        an array of integers, of size `N`.</span>
+</span><span id="UISRNN.predict_single-505"><a href="#UISRNN.predict_single-505"><span class="linenos">505</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
+</span><span id="UISRNN.predict_single-506"><a href="#UISRNN.predict_single-506"><span class="linenos">506</span></a>
+</span><span id="UISRNN.predict_single-507"><a href="#UISRNN.predict_single-507"><span class="linenos">507</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.predict_single-508"><a href="#UISRNN.predict_single-508"><span class="linenos">508</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
+</span><span id="UISRNN.predict_single-509"><a href="#UISRNN.predict_single-509"><span class="linenos">509</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
+</span><span id="UISRNN.predict_single-510"><a href="#UISRNN.predict_single-510"><span class="linenos">510</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.predict_single-511"><a href="#UISRNN.predict_single-511"><span class="linenos">511</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN.predict_single-512"><a href="#UISRNN.predict_single-512"><span class="linenos">512</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN.predict_single-513"><a href="#UISRNN.predict_single-513"><span class="linenos">513</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-514"><a href="#UISRNN.predict_single-514"><span class="linenos">514</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-515"><a href="#UISRNN.predict_single-515"><span class="linenos">515</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN.predict_single-516"><a href="#UISRNN.predict_single-516"><span class="linenos">516</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN.predict_single-517"><a href="#UISRNN.predict_single-517"><span class="linenos">517</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-518"><a href="#UISRNN.predict_single-518"><span class="linenos">518</span></a>    <span class="c1"># check size</span>
+</span><span id="UISRNN.predict_single-519"><a href="#UISRNN.predict_single-519"><span class="linenos">519</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN.predict_single-520"><a href="#UISRNN.predict_single-520"><span class="linenos">520</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN.predict_single-521"><a href="#UISRNN.predict_single-521"><span class="linenos">521</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN.predict_single-522"><a href="#UISRNN.predict_single-522"><span class="linenos">522</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-523"><a href="#UISRNN.predict_single-523"><span class="linenos">523</span></a>
+</span><span id="UISRNN.predict_single-524"><a href="#UISRNN.predict_single-524"><span class="linenos">524</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+</span><span id="UISRNN.predict_single-525"><a href="#UISRNN.predict_single-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN.predict_single-526"><a href="#UISRNN.predict_single-526"><span class="linenos">526</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-527"><a href="#UISRNN.predict_single-527"><span class="linenos">527</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-528"><a href="#UISRNN.predict_single-528"><span class="linenos">528</span></a>    <span class="c1"># bookkeeping for beam search</span>
+</span><span id="UISRNN.predict_single-529"><a href="#UISRNN.predict_single-529"><span class="linenos">529</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
+</span><span id="UISRNN.predict_single-530"><a href="#UISRNN.predict_single-530"><span class="linenos">530</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
+</span><span id="UISRNN.predict_single-531"><a href="#UISRNN.predict_single-531"><span class="linenos">531</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-532"><a href="#UISRNN.predict_single-532"><span class="linenos">532</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
+</span><span id="UISRNN.predict_single-533"><a href="#UISRNN.predict_single-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
+</span><span id="UISRNN.predict_single-534"><a href="#UISRNN.predict_single-534"><span class="linenos">534</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="UISRNN.predict_single-535"><a href="#UISRNN.predict_single-535"><span class="linenos">535</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-536"><a href="#UISRNN.predict_single-536"><span class="linenos">536</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-537"><a href="#UISRNN.predict_single-537"><span class="linenos">537</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-538"><a href="#UISRNN.predict_single-538"><span class="linenos">538</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
+</span><span id="UISRNN.predict_single-539"><a href="#UISRNN.predict_single-539"><span class="linenos">539</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-540"><a href="#UISRNN.predict_single-540"><span class="linenos">540</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-541"><a href="#UISRNN.predict_single-541"><span class="linenos">541</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-542"><a href="#UISRNN.predict_single-542"><span class="linenos">542</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
+</span><span id="UISRNN.predict_single-543"><a href="#UISRNN.predict_single-543"><span class="linenos">543</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
+</span><span id="UISRNN.predict_single-544"><a href="#UISRNN.predict_single-544"><span class="linenos">544</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
+</span><span id="UISRNN.predict_single-545"><a href="#UISRNN.predict_single-545"><span class="linenos">545</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
+</span><span id="UISRNN.predict_single-546"><a href="#UISRNN.predict_single-546"><span class="linenos">546</span></a>      <span class="c1"># find top scores</span>
+</span><span id="UISRNN.predict_single-547"><a href="#UISRNN.predict_single-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-548"><a href="#UISRNN.predict_single-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="UISRNN.predict_single-549"><a href="#UISRNN.predict_single-549"><span class="linenos">549</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-550"><a href="#UISRNN.predict_single-550"><span class="linenos">550</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-551"><a href="#UISRNN.predict_single-551"><span class="linenos">551</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN.predict_single-552"><a href="#UISRNN.predict_single-552"><span class="linenos">552</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-553"><a href="#UISRNN.predict_single-553"><span class="linenos">553</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
+</span><span id="UISRNN.predict_single-554"><a href="#UISRNN.predict_single-554"><span class="linenos">554</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
+</span><span id="UISRNN.predict_single-555"><a href="#UISRNN.predict_single-555"><span class="linenos">555</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-556"><a href="#UISRNN.predict_single-556"><span class="linenos">556</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
+</span><span id="UISRNN.predict_single-557"><a href="#UISRNN.predict_single-557"><span class="linenos">557</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="UISRNN.predict_single-558"><a href="#UISRNN.predict_single-558"><span class="linenos">558</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-559"><a href="#UISRNN.predict_single-559"><span class="linenos">559</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-560"><a href="#UISRNN.predict_single-560"><span class="linenos">560</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-561"><a href="#UISRNN.predict_single-561"><span class="linenos">561</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
+</span><span id="UISRNN.predict_single-562"><a href="#UISRNN.predict_single-562"><span class="linenos">562</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
+</span><span id="UISRNN.predict_single-563"><a href="#UISRNN.predict_single-563"><span class="linenos">563</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
 </span></pre></div>
 
 
@@ -1696,9 +1697,12 @@ <h1 class="modulename">
  [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance 'iccc'
  [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance 'iccc'
  [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance 'iccc'
+</code></pre></p>
+
+<pre><code>Here `N=5`, `D=4`.
 </code></pre>
-    Here <code>N=5</code>, <code>D=4</code>.
-  args: Inference configurations. See <code>arguments.py</code> for details.</p>
+
+<p>args: Inference configurations. See <code>arguments.py</code> for details.</p>
 
 <p>Returns:
   predicted_cluster_id: predicted speaker id sequence, which is
@@ -1723,33 +1727,33 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#UISRNN.predict"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict-564"><a href="#UISRNN.predict-564"><span class="linenos">564</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.predict-565"><a href="#UISRNN.predict-565"><span class="linenos">565</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
-</span><span id="UISRNN.predict-566"><a href="#UISRNN.predict-566"><span class="linenos">566</span></a>
-</span><span id="UISRNN.predict-567"><a href="#UISRNN.predict-567"><span class="linenos">567</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.predict-568"><a href="#UISRNN.predict-568"><span class="linenos">568</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
-</span><span id="UISRNN.predict-569"><a href="#UISRNN.predict-569"><span class="linenos">569</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="UISRNN.predict-570"><a href="#UISRNN.predict-570"><span class="linenos">570</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
-</span><span id="UISRNN.predict-571"><a href="#UISRNN.predict-571"><span class="linenos">571</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.predict-572"><a href="#UISRNN.predict-572"><span class="linenos">572</span></a>
-</span><span id="UISRNN.predict-573"><a href="#UISRNN.predict-573"><span class="linenos">573</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN.predict-574"><a href="#UISRNN.predict-574"><span class="linenos">574</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
-</span><span id="UISRNN.predict-575"><a href="#UISRNN.predict-575"><span class="linenos">575</span></a>
-</span><span id="UISRNN.predict-576"><a href="#UISRNN.predict-576"><span class="linenos">576</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
-</span><span id="UISRNN.predict-577"><a href="#UISRNN.predict-577"><span class="linenos">577</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
-</span><span id="UISRNN.predict-578"><a href="#UISRNN.predict-578"><span class="linenos">578</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
-</span><span id="UISRNN.predict-579"><a href="#UISRNN.predict-579"><span class="linenos">579</span></a><span class="sd">           be a 1-dim list of strings</span>
-</span><span id="UISRNN.predict-580"><a href="#UISRNN.predict-580"><span class="linenos">580</span></a>
-</span><span id="UISRNN.predict-581"><a href="#UISRNN.predict-581"><span class="linenos">581</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.predict-582"><a href="#UISRNN.predict-582"><span class="linenos">582</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="UISRNN.predict-583"><a href="#UISRNN.predict-583"><span class="linenos">583</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.predict-584"><a href="#UISRNN.predict-584"><span class="linenos">584</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN.predict-585"><a href="#UISRNN.predict-585"><span class="linenos">585</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN.predict-586"><a href="#UISRNN.predict-586"><span class="linenos">586</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN.predict-587"><a href="#UISRNN.predict-587"><span class="linenos">587</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN.predict-588"><a href="#UISRNN.predict-588"><span class="linenos">588</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN.predict-589"><a href="#UISRNN.predict-589"><span class="linenos">589</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
-</span><span id="UISRNN.predict-590"><a href="#UISRNN.predict-590"><span class="linenos">590</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict-565"><a href="#UISRNN.predict-565"><span class="linenos">565</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.predict-566"><a href="#UISRNN.predict-566"><span class="linenos">566</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
+</span><span id="UISRNN.predict-567"><a href="#UISRNN.predict-567"><span class="linenos">567</span></a>
+</span><span id="UISRNN.predict-568"><a href="#UISRNN.predict-568"><span class="linenos">568</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.predict-569"><a href="#UISRNN.predict-569"><span class="linenos">569</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
+</span><span id="UISRNN.predict-570"><a href="#UISRNN.predict-570"><span class="linenos">570</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="UISRNN.predict-571"><a href="#UISRNN.predict-571"><span class="linenos">571</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
+</span><span id="UISRNN.predict-572"><a href="#UISRNN.predict-572"><span class="linenos">572</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.predict-573"><a href="#UISRNN.predict-573"><span class="linenos">573</span></a>
+</span><span id="UISRNN.predict-574"><a href="#UISRNN.predict-574"><span class="linenos">574</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN.predict-575"><a href="#UISRNN.predict-575"><span class="linenos">575</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
+</span><span id="UISRNN.predict-576"><a href="#UISRNN.predict-576"><span class="linenos">576</span></a>
+</span><span id="UISRNN.predict-577"><a href="#UISRNN.predict-577"><span class="linenos">577</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
+</span><span id="UISRNN.predict-578"><a href="#UISRNN.predict-578"><span class="linenos">578</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
+</span><span id="UISRNN.predict-579"><a href="#UISRNN.predict-579"><span class="linenos">579</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
+</span><span id="UISRNN.predict-580"><a href="#UISRNN.predict-580"><span class="linenos">580</span></a><span class="sd">           be a 1-dim list of strings</span>
+</span><span id="UISRNN.predict-581"><a href="#UISRNN.predict-581"><span class="linenos">581</span></a>
+</span><span id="UISRNN.predict-582"><a href="#UISRNN.predict-582"><span class="linenos">582</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.predict-583"><a href="#UISRNN.predict-583"><span class="linenos">583</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="UISRNN.predict-584"><a href="#UISRNN.predict-584"><span class="linenos">584</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.predict-585"><a href="#UISRNN.predict-585"><span class="linenos">585</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN.predict-586"><a href="#UISRNN.predict-586"><span class="linenos">586</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN.predict-587"><a href="#UISRNN.predict-587"><span class="linenos">587</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN.predict-588"><a href="#UISRNN.predict-588"><span class="linenos">588</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN.predict-589"><a href="#UISRNN.predict-589"><span class="linenos">589</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN.predict-590"><a href="#UISRNN.predict-590"><span class="linenos">590</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
+</span><span id="UISRNN.predict-591"><a href="#UISRNN.predict-591"><span class="linenos">591</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1788,37 +1792,37 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#parallel_predict"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="parallel_predict-593"><a href="#parallel_predict-593"><span class="linenos">593</span></a><span class="k">def</span> <span class="nf">parallel_predict</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">num_processes</span><span class="o">=</span><span class="mi">4</span><span class="p">):</span>
-</span><span id="parallel_predict-594"><a href="#parallel_predict-594"><span class="linenos">594</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Run prediction in parallel using torch.multiprocessing.</span>
-</span><span id="parallel_predict-595"><a href="#parallel_predict-595"><span class="linenos">595</span></a>
-</span><span id="parallel_predict-596"><a href="#parallel_predict-596"><span class="linenos">596</span></a><span class="sd">  This is a beta feature. It makes prediction slower on CPU. But it&#39;s reported</span>
-</span><span id="parallel_predict-597"><a href="#parallel_predict-597"><span class="linenos">597</span></a><span class="sd">  that it makes prediction faster on GPU.</span>
-</span><span id="parallel_predict-598"><a href="#parallel_predict-598"><span class="linenos">598</span></a>
-</span><span id="parallel_predict-599"><a href="#parallel_predict-599"><span class="linenos">599</span></a><span class="sd">  Args:</span>
-</span><span id="parallel_predict-600"><a href="#parallel_predict-600"><span class="linenos">600</span></a><span class="sd">    model: instance of UISRNN model</span>
-</span><span id="parallel_predict-601"><a href="#parallel_predict-601"><span class="linenos">601</span></a><span class="sd">    test_sequences: a list of test sequences, or a single test</span>
-</span><span id="parallel_predict-602"><a href="#parallel_predict-602"><span class="linenos">602</span></a><span class="sd">      sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="parallel_predict-603"><a href="#parallel_predict-603"><span class="linenos">603</span></a><span class="sd">      of real numbers. See `predict_single()` for details.</span>
-</span><span id="parallel_predict-604"><a href="#parallel_predict-604"><span class="linenos">604</span></a><span class="sd">    args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="parallel_predict-605"><a href="#parallel_predict-605"><span class="linenos">605</span></a><span class="sd">    num_processes: number of parallel processes.</span>
-</span><span id="parallel_predict-606"><a href="#parallel_predict-606"><span class="linenos">606</span></a>
-</span><span id="parallel_predict-607"><a href="#parallel_predict-607"><span class="linenos">607</span></a><span class="sd">  Returns:</span>
-</span><span id="parallel_predict-608"><a href="#parallel_predict-608"><span class="linenos">608</span></a><span class="sd">    a list of the same size as test_sequences, where each element</span>
-</span><span id="parallel_predict-609"><a href="#parallel_predict-609"><span class="linenos">609</span></a><span class="sd">    being a 1-dim list of strings.</span>
-</span><span id="parallel_predict-610"><a href="#parallel_predict-610"><span class="linenos">610</span></a>
-</span><span id="parallel_predict-611"><a href="#parallel_predict-611"><span class="linenos">611</span></a><span class="sd">  Raises:</span>
-</span><span id="parallel_predict-612"><a href="#parallel_predict-612"><span class="linenos">612</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="parallel_predict-613"><a href="#parallel_predict-613"><span class="linenos">613</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="parallel_predict-614"><a href="#parallel_predict-614"><span class="linenos">614</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="parallel_predict-615"><a href="#parallel_predict-615"><span class="linenos">615</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences must be a list.&#39;</span><span class="p">)</span>
-</span><span id="parallel_predict-616"><a href="#parallel_predict-616"><span class="linenos">616</span></a>  <span class="n">ctx</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">get_context</span><span class="p">(</span><span class="s1">&#39;forkserver&#39;</span><span class="p">)</span>
-</span><span id="parallel_predict-617"><a href="#parallel_predict-617"><span class="linenos">617</span></a>  <span class="n">model</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">share_memory</span><span class="p">()</span>
-</span><span id="parallel_predict-618"><a href="#parallel_predict-618"><span class="linenos">618</span></a>  <span class="n">pool</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">num_processes</span><span class="p">)</span>
-</span><span id="parallel_predict-619"><a href="#parallel_predict-619"><span class="linenos">619</span></a>  <span class="n">results</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="parallel_predict-620"><a href="#parallel_predict-620"><span class="linenos">620</span></a>      <span class="n">functools</span><span class="o">.</span><span class="n">partial</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">predict_single</span><span class="p">,</span> <span class="n">args</span><span class="o">=</span><span class="n">args</span><span class="p">),</span>
-</span><span id="parallel_predict-621"><a href="#parallel_predict-621"><span class="linenos">621</span></a>      <span class="n">test_sequences</span><span class="p">)</span>
-</span><span id="parallel_predict-622"><a href="#parallel_predict-622"><span class="linenos">622</span></a>  <span class="n">pool</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
-</span><span id="parallel_predict-623"><a href="#parallel_predict-623"><span class="linenos">623</span></a>  <span class="k">return</span> <span class="n">results</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="parallel_predict-594"><a href="#parallel_predict-594"><span class="linenos">594</span></a><span class="k">def</span> <span class="nf">parallel_predict</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">num_processes</span><span class="o">=</span><span class="mi">4</span><span class="p">):</span>
+</span><span id="parallel_predict-595"><a href="#parallel_predict-595"><span class="linenos">595</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Run prediction in parallel using torch.multiprocessing.</span>
+</span><span id="parallel_predict-596"><a href="#parallel_predict-596"><span class="linenos">596</span></a>
+</span><span id="parallel_predict-597"><a href="#parallel_predict-597"><span class="linenos">597</span></a><span class="sd">  This is a beta feature. It makes prediction slower on CPU. But it&#39;s reported</span>
+</span><span id="parallel_predict-598"><a href="#parallel_predict-598"><span class="linenos">598</span></a><span class="sd">  that it makes prediction faster on GPU.</span>
+</span><span id="parallel_predict-599"><a href="#parallel_predict-599"><span class="linenos">599</span></a>
+</span><span id="parallel_predict-600"><a href="#parallel_predict-600"><span class="linenos">600</span></a><span class="sd">  Args:</span>
+</span><span id="parallel_predict-601"><a href="#parallel_predict-601"><span class="linenos">601</span></a><span class="sd">    model: instance of UISRNN model</span>
+</span><span id="parallel_predict-602"><a href="#parallel_predict-602"><span class="linenos">602</span></a><span class="sd">    test_sequences: a list of test sequences, or a single test</span>
+</span><span id="parallel_predict-603"><a href="#parallel_predict-603"><span class="linenos">603</span></a><span class="sd">      sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="parallel_predict-604"><a href="#parallel_predict-604"><span class="linenos">604</span></a><span class="sd">      of real numbers. See `predict_single()` for details.</span>
+</span><span id="parallel_predict-605"><a href="#parallel_predict-605"><span class="linenos">605</span></a><span class="sd">    args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="parallel_predict-606"><a href="#parallel_predict-606"><span class="linenos">606</span></a><span class="sd">    num_processes: number of parallel processes.</span>
+</span><span id="parallel_predict-607"><a href="#parallel_predict-607"><span class="linenos">607</span></a>
+</span><span id="parallel_predict-608"><a href="#parallel_predict-608"><span class="linenos">608</span></a><span class="sd">  Returns:</span>
+</span><span id="parallel_predict-609"><a href="#parallel_predict-609"><span class="linenos">609</span></a><span class="sd">    a list of the same size as test_sequences, where each element</span>
+</span><span id="parallel_predict-610"><a href="#parallel_predict-610"><span class="linenos">610</span></a><span class="sd">    being a 1-dim list of strings.</span>
+</span><span id="parallel_predict-611"><a href="#parallel_predict-611"><span class="linenos">611</span></a>
+</span><span id="parallel_predict-612"><a href="#parallel_predict-612"><span class="linenos">612</span></a><span class="sd">  Raises:</span>
+</span><span id="parallel_predict-613"><a href="#parallel_predict-613"><span class="linenos">613</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="parallel_predict-614"><a href="#parallel_predict-614"><span class="linenos">614</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="parallel_predict-615"><a href="#parallel_predict-615"><span class="linenos">615</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="parallel_predict-616"><a href="#parallel_predict-616"><span class="linenos">616</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences must be a list.&#39;</span><span class="p">)</span>
+</span><span id="parallel_predict-617"><a href="#parallel_predict-617"><span class="linenos">617</span></a>  <span class="n">ctx</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">get_context</span><span class="p">(</span><span class="s1">&#39;forkserver&#39;</span><span class="p">)</span>
+</span><span id="parallel_predict-618"><a href="#parallel_predict-618"><span class="linenos">618</span></a>  <span class="n">model</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">share_memory</span><span class="p">()</span>
+</span><span id="parallel_predict-619"><a href="#parallel_predict-619"><span class="linenos">619</span></a>  <span class="n">pool</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">num_processes</span><span class="p">)</span>
+</span><span id="parallel_predict-620"><a href="#parallel_predict-620"><span class="linenos">620</span></a>  <span class="n">results</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="parallel_predict-621"><a href="#parallel_predict-621"><span class="linenos">621</span></a>      <span class="n">functools</span><span class="o">.</span><span class="n">partial</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">predict_single</span><span class="p">,</span> <span class="n">args</span><span class="o">=</span><span class="n">args</span><span class="p">),</span>
+</span><span id="parallel_predict-622"><a href="#parallel_predict-622"><span class="linenos">622</span></a>      <span class="n">test_sequences</span><span class="p">)</span>
+</span><span id="parallel_predict-623"><a href="#parallel_predict-623"><span class="linenos">623</span></a>  <span class="n">pool</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="parallel_predict-624"><a href="#parallel_predict-624"><span class="linenos">624</span></a>  <span class="k">return</span> <span class="n">results</span>
 </span></pre></div>
 
 
diff --git a/docs/uisrnn/arguments.html b/docs/uisrnn/arguments.html
index b258153..63673e9 100644
--- a/docs/uisrnn/arguments.html
+++ b/docs/uisrnn/arguments.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.arguments API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
@@ -148,12 +148,12 @@ <h1 class="modulename">
 </span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>           <span class="s1">&#39;value is None, we will estimate it from training data.&#39;</span><span class="p">)</span>
 </span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>  <span class="n">model_parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span>
 </span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>      <span class="s1">&#39;--verbosity&#39;</span><span class="p">,</span>
-</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>      <span class="n">default</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>      <span class="n">default</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
 </span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>      <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span>
 </span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;How verbose will the logging information be. Higher value &#39;</span>
 </span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>      <span class="s1">&#39;represents more verbose information. A general guideline: &#39;</span>
-</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>      <span class="s1">&#39;0 for errors; 1 for finishing important steps; &#39;</span>
-</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>      <span class="s1">&#39;2 for finishing less important steps; 3 or above for debugging &#39;</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>      <span class="s1">&#39;0 for fatals; 1 for errors; 2 for finishing important steps; &#39;</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>      <span class="s1">&#39;3 for finishing less important steps; 4 or above for debugging &#39;</span>
 </span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>      <span class="s1">&#39;information.&#39;</span><span class="p">)</span>
 </span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>  <span class="n">model_parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span>
 </span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>      <span class="s1">&#39;--enable_cuda&#39;</span><span class="p">,</span>
@@ -365,12 +365,12 @@ <h1 class="modulename">
 </span><span id="parse_arguments-88"><a href="#parse_arguments-88"><span class="linenos"> 88</span></a>           <span class="s1">&#39;value is None, we will estimate it from training data.&#39;</span><span class="p">)</span>
 </span><span id="parse_arguments-89"><a href="#parse_arguments-89"><span class="linenos"> 89</span></a>  <span class="n">model_parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span>
 </span><span id="parse_arguments-90"><a href="#parse_arguments-90"><span class="linenos"> 90</span></a>      <span class="s1">&#39;--verbosity&#39;</span><span class="p">,</span>
-</span><span id="parse_arguments-91"><a href="#parse_arguments-91"><span class="linenos"> 91</span></a>      <span class="n">default</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
+</span><span id="parse_arguments-91"><a href="#parse_arguments-91"><span class="linenos"> 91</span></a>      <span class="n">default</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
 </span><span id="parse_arguments-92"><a href="#parse_arguments-92"><span class="linenos"> 92</span></a>      <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span>
 </span><span id="parse_arguments-93"><a href="#parse_arguments-93"><span class="linenos"> 93</span></a>      <span class="n">help</span><span class="o">=</span><span class="s1">&#39;How verbose will the logging information be. Higher value &#39;</span>
 </span><span id="parse_arguments-94"><a href="#parse_arguments-94"><span class="linenos"> 94</span></a>      <span class="s1">&#39;represents more verbose information. A general guideline: &#39;</span>
-</span><span id="parse_arguments-95"><a href="#parse_arguments-95"><span class="linenos"> 95</span></a>      <span class="s1">&#39;0 for errors; 1 for finishing important steps; &#39;</span>
-</span><span id="parse_arguments-96"><a href="#parse_arguments-96"><span class="linenos"> 96</span></a>      <span class="s1">&#39;2 for finishing less important steps; 3 or above for debugging &#39;</span>
+</span><span id="parse_arguments-95"><a href="#parse_arguments-95"><span class="linenos"> 95</span></a>      <span class="s1">&#39;0 for fatals; 1 for errors; 2 for finishing important steps; &#39;</span>
+</span><span id="parse_arguments-96"><a href="#parse_arguments-96"><span class="linenos"> 96</span></a>      <span class="s1">&#39;3 for finishing less important steps; 4 or above for debugging &#39;</span>
 </span><span id="parse_arguments-97"><a href="#parse_arguments-97"><span class="linenos"> 97</span></a>      <span class="s1">&#39;information.&#39;</span><span class="p">)</span>
 </span><span id="parse_arguments-98"><a href="#parse_arguments-98"><span class="linenos"> 98</span></a>  <span class="n">model_parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span>
 </span><span id="parse_arguments-99"><a href="#parse_arguments-99"><span class="linenos"> 99</span></a>      <span class="s1">&#39;--enable_cuda&#39;</span><span class="p">,</span>
diff --git a/docs/uisrnn/contrib.html b/docs/uisrnn/contrib.html
index 259503e..c8aa990 100644
--- a/docs/uisrnn/contrib.html
+++ b/docs/uisrnn/contrib.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.contrib API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
diff --git a/docs/uisrnn/contrib/contrib_template.html b/docs/uisrnn/contrib/contrib_template.html
index 6621ff1..873c1d5 100644
--- a/docs/uisrnn/contrib/contrib_template.html
+++ b/docs/uisrnn/contrib/contrib_template.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.contrib.contrib_template API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
diff --git a/docs/uisrnn/contrib/range_search_crp_alpha.html b/docs/uisrnn/contrib/range_search_crp_alpha.html
index 44fbbde..37b93a2 100644
--- a/docs/uisrnn/contrib/range_search_crp_alpha.html
+++ b/docs/uisrnn/contrib/range_search_crp_alpha.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.contrib.range_search_crp_alpha API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
@@ -51,14 +51,16 @@ <h1 class="modulename">
 
                         <div class="docstring"><p>This module implements method to search for best crp_alpha within a range for
 a given data set.
- For example
- <pre><code>  train_cluster_id = np.array(
+ For example</p>
+
+<p><pre><code>  train_cluster_id = np.array(
     ['0_0', '0_0', '0_1', '0_1', '0_1', '0_0', '0_0', '1_0', '1_0', '1_0',
     '1_1', '1_1', '1_1', '1_0', '1_0','1_0', '1_2', '1_2', '1_2'])
   print(estimate_crp_alpha(train_cluster_id))
   0.5
-</code></pre>
- Function for user:
+</code></pre></p>
+
+<p>Function for user:
    estimate_crp_alpha: see docstring for details.
  Internal functions:
    _get_cdf: see docstring for details.
diff --git a/docs/uisrnn/evals.html b/docs/uisrnn/evals.html
index a616862..9704650 100644
--- a/docs/uisrnn/evals.html
+++ b/docs/uisrnn/evals.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.evals API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
diff --git a/docs/uisrnn/loss_func.html b/docs/uisrnn/loss_func.html
index 017f560..d7a6b89 100644
--- a/docs/uisrnn/loss_func.html
+++ b/docs/uisrnn/loss_func.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.loss_func API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
diff --git a/docs/uisrnn/uisrnn.html b/docs/uisrnn/uisrnn.html
index 1b6d9bc..b828166 100644
--- a/docs/uisrnn/uisrnn.html
+++ b/docs/uisrnn/uisrnn.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.uisrnn API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
@@ -164,613 +164,614 @@ <h1 class="modulename">
 </span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="c1"># limitations under the License.</span>
 </span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="sd">&quot;&quot;&quot;The UIS-RNN model.&quot;&quot;&quot;</span>
 </span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a>
-</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a><span class="kn">import</span> <span class="nn">functools</span>
-</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="kn">import</span> <span class="nn">torch</span>
-</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">autograd</span>
-</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">multiprocessing</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">nn</span>
-</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">optim</span>
-</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="kn">import</span> <span class="nn">torch.nn.functional</span> <span class="k">as</span> <span class="nn">F</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>
-</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="kn">from</span> <span class="nn">uisrnn</span> <span class="kn">import</span> <span class="n">loss_func</span>
-</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="kn">from</span> <span class="nn">uisrnn</span> <span class="kn">import</span> <span class="n">utils</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>
-</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="o">=</span> <span class="mf">0.1</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a><span class="kn">import</span> <span class="nn">colortimelog</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="kn">import</span> <span class="nn">functools</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">autograd</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">multiprocessing</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">nn</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">optim</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="kn">import</span> <span class="nn">torch.nn.functional</span> <span class="k">as</span> <span class="nn">F</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="kn">from</span> <span class="nn">uisrnn</span> <span class="kn">import</span> <span class="n">loss_func</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a><span class="kn">from</span> <span class="nn">uisrnn</span> <span class="kn">import</span> <span class="n">utils</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a><span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="o">=</span> <span class="mf">0.1</span>
 </span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>
-</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="k">class</span> <span class="nc">CoreRNN</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
-</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;The core Recurent Neural Network used by UIS-RNN.&quot;&quot;&quot;</span>
-</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>
-</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>    <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span> <span class="o">=</span> <span class="n">hidden_size</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>    <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="n">dropout</span><span class="p">)</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">)</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">)</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>
-</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>  <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The forward function of the module.&quot;&quot;&quot;</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>    <span class="n">output_seq</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gru</span><span class="p">(</span><span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_seq</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">PackedSequence</span><span class="p">):</span>
-</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>      <span class="n">output_seq</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pad_packed_sequence</span><span class="p">(</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>          <span class="n">output_seq</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>    <span class="n">mean</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span><span class="p">(</span><span class="n">F</span><span class="o">.</span><span class="n">relu</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span><span class="p">(</span><span class="n">output_seq</span><span class="p">)))</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>    <span class="k">return</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="k">class</span> <span class="nc">CoreRNN</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;The core Recurent Neural Network used by UIS-RNN.&quot;&quot;&quot;</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>    <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span> <span class="o">=</span> <span class="n">hidden_size</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>    <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="n">dropout</span><span class="p">)</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">)</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">)</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>  <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The forward function of the module.&quot;&quot;&quot;</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>    <span class="n">output_seq</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gru</span><span class="p">(</span><span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_seq</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">PackedSequence</span><span class="p">):</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>      <span class="n">output_seq</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pad_packed_sequence</span><span class="p">(</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>          <span class="n">output_seq</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>    <span class="n">mean</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span><span class="p">(</span><span class="n">F</span><span class="o">.</span><span class="n">relu</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span><span class="p">(</span><span class="n">output_seq</span><span class="p">)))</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>    <span class="k">return</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span>
 </span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>
-</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="k">class</span> <span class="nc">BeamState</span><span class="p">:</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Structure that contains necessary states for beam search.&quot;&quot;&quot;</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>
-</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">source</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">source</span><span class="p">:</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">neg_likelihood</span>
-</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>
-</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>  <span class="k">def</span> <span class="nf">append</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">):</span>
-</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Append new item to the BeamState.&quot;&quot;&quot;</span>
-</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
-</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
-</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
-</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="k">class</span> <span class="nc">BeamState</span><span class="p">:</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Structure that contains necessary states for beam search.&quot;&quot;&quot;</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">source</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">source</span><span class="p">:</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">neg_likelihood</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>  <span class="k">def</span> <span class="nf">append</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">):</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Append new item to the BeamState.&quot;&quot;&quot;</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
 </span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>
-</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a><span class="k">class</span> <span class="nc">UISRNN</span><span class="p">:</span>
-</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Unbounded Interleaved-State Recurrent Neural Networks.&quot;&quot;&quot;</span>
-</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>
-</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
-</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>
-</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a><span class="sd">    Args:</span>
-</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
-</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
-</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
-</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
-</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
-</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>    <span class="c1"># initial values of variables</span>
-</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
-</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
-</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
-</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>
-</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>  <span class="k">def</span> <span class="nf">_get_optimizer</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">optimizer</span><span class="p">,</span> <span class="n">learning_rate</span><span class="p">):</span>
-</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Get optimizer for UISRNN.</span>
-</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>
-</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">    Args:</span>
-</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a><span class="sd">      optimizer: string - name of the optimizer.</span>
-</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">      learning_rate: - learning rate for the entire model.</span>
-</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a><span class="sd">        We do not customize learning rate for separate parts.</span>
-</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>
-</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a><span class="sd">    Returns:</span>
-</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a><span class="sd">      a pytorch &quot;optim&quot; object</span>
-</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>    <span class="n">params</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>        <span class="p">{</span>
-</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
-</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>        <span class="p">},</span>  <span class="c1"># rnn parameters</span>
-</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>        <span class="p">{</span>
-</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span>
-</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="p">}</span>  <span class="c1"># rnn initial hidden state</span>
-</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>    <span class="p">]</span>
-</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span><span class="p">:</span>  <span class="c1"># train sigma2</span>
-</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>      <span class="n">params</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>          <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>      <span class="p">})</span>  <span class="c1"># variance parameters</span>
-</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>    <span class="k">assert</span> <span class="n">optimizer</span> <span class="o">==</span> <span class="s1">&#39;adam&#39;</span><span class="p">,</span> <span class="s1">&#39;Only adam optimizer is supported.&#39;</span>
-</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>    <span class="k">return</span> <span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>
-</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
-</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>
-</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a><span class="sd">    Args:</span>
-</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
-</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
-</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
-</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
-</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
-</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>
-</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
-</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>
-</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a><span class="sd">    Args:</span>
-</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
-</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
-</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
-</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
-</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
-</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
-</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>
-</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
-</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
-</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
-</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>
-</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
-</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>
-</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a><span class="sd">    Args:</span>
-</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
-</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
-</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>
-</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
-</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a><span class="sd">        - `D`: observation dimension.</span>
-</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>
-</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">        For example,</span>
-</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">      ```</span>
-</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">      train_sequence =</span>
-</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
-</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a><span class="sd">      ```</span>
-</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>
-</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
-</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
-</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
-</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a><span class="sd">        For example,</span>
-</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a><span class="sd">      ```</span>
-</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a><span class="sd">      train_cluster_id =</span>
-</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
-</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a><span class="sd">      ```</span>
-</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
-</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>
-</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
-</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
-</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>
-</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a><span class="sd">    Raises:</span>
-</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
-</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
-</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>    <span class="c1"># check type</span>
-</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
-</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
-</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
-</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>    <span class="c1"># check dimension</span>
-</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
-</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>    <span class="c1"># check length and size</span>
-</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
-</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
-</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
-</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
-</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a>
-</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
-</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
-</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>
-</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
-</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
-</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
-</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
-</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>
-</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
-</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
-</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
-</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
-</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>      <span class="c1"># use mean to predict</span>
-</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
-</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
-</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
-</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
-</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
-</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>
-</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>      <span class="c1"># Likelihood part.</span>
-</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
-</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
-</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
-</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>
-</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a>      <span class="c1"># Sigma2 prior part.</span>
-</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
-</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
-</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
-</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
-</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>
-</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>      <span class="c1"># Regularization part.</span>
-</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
-</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
-</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>
-</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
-</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
-</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
-</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
-</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>      <span class="c1"># avoid numerical issues</span>
-</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
-</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>
-</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
-</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>                <span class="n">num_iter</span><span class="p">,</span>
-</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
-</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
-</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
-</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>
-</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
-</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>
-</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a><span class="sd">    Args:</span>
-</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
-</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a><span class="sd">        concatenated training sequence:</span>
-</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>
-</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
-</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
-</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
-</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
-</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a><span class="sd">           embeddings of one utterance.</span>
-</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
-</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
-</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a><span class="sd">           for more details.</span>
-</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
-</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>
-</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
-</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
-</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
-</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
-</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>
-</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a><span class="sd">    Raises:</span>
-</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
-</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
-</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
-</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
-</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
-</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
-</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
-</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
-</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
-</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
-</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
-</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
-</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a>      <span class="k">pass</span>
-</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a>
-</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>    <span class="c1"># estimate transition_bias</span>
-</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
-</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
-</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>      <span class="c1"># set or update transition_bias</span>
-</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
-</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>      <span class="k">else</span><span class="p">:</span>
-</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
-</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
-</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>
-</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>    <span class="c1"># concatenate train_sequences</span>
-</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
-</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
-</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
-</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
-</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
-</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>         <span class="kc">True</span><span class="p">)</span>
-</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>
-</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
-</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>
-</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>  <span class="k">def</span> <span class="nf">_update_beam_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">):</span>
-</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update a beam state given a look ahead sequence and known cluster</span>
-</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a><span class="sd">    assignments.</span>
-</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>
-</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a><span class="sd">    Args:</span>
-</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a><span class="sd">      beam_state: A BeamState object.</span>
-</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
-</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
-</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a><span class="sd">        D: observation dimension</span>
-</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a><span class="sd">      cluster_seq: Cluster assignment sequence for look_ahead_seq.</span>
-</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>
-</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a><span class="sd">    Returns:</span>
-</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a><span class="sd">      new_beam_state: An updated BeamState object.</span>
-</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>
-</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>    <span class="n">loss</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>    <span class="n">new_beam_state</span> <span class="o">=</span> <span class="n">BeamState</span><span class="p">(</span><span class="n">beam_state</span><span class="p">)</span>
-</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>    <span class="k">for</span> <span class="n">sub_idx</span><span class="p">,</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster_seq</span><span class="p">):</span>
-</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>      <span class="k">if</span> <span class="n">cluster</span> <span class="o">&gt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># invalid trace</span>
-</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
-</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>        <span class="k">break</span>
-</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>      <span class="k">elif</span> <span class="n">cluster</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># existing cluster</span>
-</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>        <span class="n">last_cluster</span> <span class="o">=</span> <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]),</span>
-</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
-</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
-</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">==</span> <span class="n">last_cluster</span><span class="p">:</span>
-</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span>
-</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>              <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>                  <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
-</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>        <span class="c1"># update new mean and new hidden</span>
-</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
-</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
-</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>            <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span>
-</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span><span class="o">*</span><span class="p">(</span>
-</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>            <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span> <span class="o">-</span>
-</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>            <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span> <span class="o">+</span> <span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>                <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span>
-</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>                    <span class="nb">float</span><span class="p">)</span>  <span class="c1"># use mean to predict</span>
-</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
-</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">!=</span> <span class="n">last_cluster</span><span class="p">:</span>
-</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>          <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
-</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>      <span class="k">else</span><span class="p">:</span>  <span class="c1"># new cluster</span>
-</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>        <span class="n">init_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">init_input</span><span class="p">,</span>
-</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>                                      <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="p">)</span>
-</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">mean</span><span class="p">),</span>
-</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
-</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
-</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>        <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>                <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
-</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>        <span class="c1"># update new min and new hidden</span>
-</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
-</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
-</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>            <span class="n">hidden</span><span class="p">)</span>
-</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">)</span>
-</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>      <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">+=</span> <span class="n">loss</span>
-</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>    <span class="k">return</span> <span class="n">new_beam_state</span>
-</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>
-</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>  <span class="k">def</span> <span class="nf">_calculate_score</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">):</span>
-</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Calculate negative log likelihoods for all possible state allocations</span>
-</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a><span class="sd">       of a look ahead sequence, according to the current beam state.</span>
-</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>
-</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a><span class="sd">    Args:</span>
-</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a><span class="sd">      beam_state: A BeamState object.</span>
-</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
-</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
-</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a><span class="sd">        D: observation dimension</span>
-</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>
-</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a><span class="sd">    Returns:</span>
-</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a><span class="sd">      beam_score_set: a set of scores for each possible state allocation.</span>
-</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>
-</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>    <span class="n">look_ahead</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>    <span class="n">beam_num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span>
-</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>    <span class="n">beam_score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>        <span class="n">beam_num_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">look_ahead</span><span class="p">))</span>
-</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>    <span class="k">for</span> <span class="n">cluster_seq</span><span class="p">,</span> <span class="n">_</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">ndenumerate</span><span class="p">(</span><span class="n">beam_score_set</span><span class="p">):</span>
-</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>      <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span>
-</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>                                                   <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>      <span class="n">beam_score_set</span><span class="p">[</span><span class="n">cluster_seq</span><span class="p">]</span> <span class="o">=</span> <span class="n">updated_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span>
-</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>    <span class="k">return</span> <span class="n">beam_score_set</span>
-</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>
-</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
-</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>
-</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a><span class="sd">    Args:</span>
-</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
-</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
-</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>
-</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a><span class="sd">        - `N`: length of one test utterance.</span>
-</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a><span class="sd">        - `D` : observation dimension.</span>
-</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>
-</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a><span class="sd">        For example:</span>
-</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a><span class="sd">      ```</span>
-</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a><span class="sd">      test_sequence =</span>
-</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
-</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
-</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
-</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
-</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
-</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a><span class="sd">      ```</span>
-</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>
-</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a><span class="sd">    Returns:</span>
-</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
-</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a><span class="sd">        an array of integers, of size `N`.</span>
-</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
-</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>
-</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a><span class="sd">    Raises:</span>
-</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
-</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
-</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>    <span class="c1"># check type</span>
-</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>    <span class="c1"># check dimension</span>
-</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>    <span class="c1"># check size</span>
-</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
-</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>
-</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
-</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>    <span class="c1"># bookkeeping for beam search</span>
-</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
-</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
-</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
-</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
-</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
-</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
-</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
-</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
-</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
-</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
-</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
-</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
-</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>      <span class="c1"># find top scores</span>
-</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
-</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
-</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
-</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
-</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
-</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
-</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
-</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
-</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
-</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
-</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
-</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>
-</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
-</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>
-</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a><span class="sd">    Args:</span>
-</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
-</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
-</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>
-</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a><span class="sd">    Returns:</span>
-</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
-</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>
-</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
-</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
-</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
-</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a><span class="sd">           be a 1-dim list of strings</span>
-</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>
-</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a><span class="sd">    Raises:</span>
-</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>    <span class="c1"># check type</span>
-</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
-</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
-</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="k">class</span> <span class="nc">UISRNN</span><span class="p">:</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Unbounded Interleaved-State Recurrent Neural Networks.&quot;&quot;&quot;</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a><span class="sd">    Args:</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>    <span class="c1"># initial values of variables</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">colortimelog</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>  <span class="k">def</span> <span class="nf">_get_optimizer</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">optimizer</span><span class="p">,</span> <span class="n">learning_rate</span><span class="p">):</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Get optimizer for UISRNN.</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a><span class="sd">    Args:</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">      optimizer: string - name of the optimizer.</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a><span class="sd">      learning_rate: - learning rate for the entire model.</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="sd">        We do not customize learning rate for separate parts.</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a><span class="sd">    Returns:</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a><span class="sd">      a pytorch &quot;optim&quot; object</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>    <span class="n">params</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>        <span class="p">{</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>        <span class="p">},</span>  <span class="c1"># rnn parameters</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>        <span class="p">{</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>        <span class="p">}</span>  <span class="c1"># rnn initial hidden state</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>    <span class="p">]</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span><span class="p">:</span>  <span class="c1"># train sigma2</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>      <span class="n">params</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>          <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>      <span class="p">})</span>  <span class="c1"># variance parameters</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>    <span class="k">assert</span> <span class="n">optimizer</span> <span class="o">==</span> <span class="s1">&#39;adam&#39;</span><span class="p">,</span> <span class="s1">&#39;Only adam optimizer is supported.&#39;</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>    <span class="k">return</span> <span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a><span class="sd">    Args:</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a><span class="sd">    Args:</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">    Args:</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a><span class="sd">        - `D`: observation dimension.</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">        For example,</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">      ```</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a><span class="sd">      train_sequence =</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a><span class="sd">      ```</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a><span class="sd">        For example,</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a><span class="sd">      ```</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a><span class="sd">      train_cluster_id =</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a><span class="sd">      ```</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a><span class="sd">    Raises:</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>    <span class="c1"># check type</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>    <span class="c1"># check dimension</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>    <span class="c1"># check length and size</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>      <span class="c1"># use mean to predict</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>      <span class="c1"># Likelihood part.</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>      <span class="c1"># Sigma2 prior part.</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>      <span class="c1"># Regularization part.</span>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>      <span class="c1"># avoid numerical issues</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>                <span class="n">num_iter</span><span class="p">,</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a><span class="sd">    Args:</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a><span class="sd">        concatenated training sequence:</span>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a><span class="sd">           embeddings of one utterance.</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a><span class="sd">           for more details.</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a><span class="sd">    Raises:</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
+</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a>      <span class="k">pass</span>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>    <span class="c1"># estimate transition_bias</span>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
+</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>      <span class="c1"># set or update transition_bias</span>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
+</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>      <span class="k">else</span><span class="p">:</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>    <span class="c1"># concatenate train_sequences</span>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
+</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>         <span class="kc">True</span><span class="p">)</span>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>
+</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>  <span class="k">def</span> <span class="nf">_update_beam_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">):</span>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update a beam state given a look ahead sequence and known cluster</span>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a><span class="sd">    assignments.</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a><span class="sd">    Args:</span>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a><span class="sd">      beam_state: A BeamState object.</span>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a><span class="sd">        D: observation dimension</span>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a><span class="sd">      cluster_seq: Cluster assignment sequence for look_ahead_seq.</span>
+</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a><span class="sd">    Returns:</span>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a><span class="sd">      new_beam_state: An updated BeamState object.</span>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>
+</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>    <span class="n">loss</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>    <span class="n">new_beam_state</span> <span class="o">=</span> <span class="n">BeamState</span><span class="p">(</span><span class="n">beam_state</span><span class="p">)</span>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>    <span class="k">for</span> <span class="n">sub_idx</span><span class="p">,</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster_seq</span><span class="p">):</span>
+</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>      <span class="k">if</span> <span class="n">cluster</span> <span class="o">&gt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># invalid trace</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>        <span class="k">break</span>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>      <span class="k">elif</span> <span class="n">cluster</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># existing cluster</span>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>        <span class="n">last_cluster</span> <span class="o">=</span> <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]),</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">==</span> <span class="n">last_cluster</span><span class="p">:</span>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>              <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>                  <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>        <span class="c1"># update new mean and new hidden</span>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>            <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span><span class="o">*</span><span class="p">(</span>
+</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>            <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span> <span class="o">-</span>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>            <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span> <span class="o">+</span> <span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>                <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>                    <span class="nb">float</span><span class="p">)</span>  <span class="c1"># use mean to predict</span>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
+</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">!=</span> <span class="n">last_cluster</span><span class="p">:</span>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>          <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>      <span class="k">else</span><span class="p">:</span>  <span class="c1"># new cluster</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>        <span class="n">init_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">init_input</span><span class="p">,</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>                                      <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="p">)</span>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">mean</span><span class="p">),</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>        <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>                <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>        <span class="c1"># update new min and new hidden</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>            <span class="n">hidden</span><span class="p">)</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">)</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>      <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">+=</span> <span class="n">loss</span>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>    <span class="k">return</span> <span class="n">new_beam_state</span>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>  <span class="k">def</span> <span class="nf">_calculate_score</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">):</span>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Calculate negative log likelihoods for all possible state allocations</span>
+</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a><span class="sd">       of a look ahead sequence, according to the current beam state.</span>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a><span class="sd">    Args:</span>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a><span class="sd">      beam_state: A BeamState object.</span>
+</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a><span class="sd">        D: observation dimension</span>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a><span class="sd">    Returns:</span>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a><span class="sd">      beam_score_set: a set of scores for each possible state allocation.</span>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>    <span class="n">look_ahead</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>    <span class="n">beam_num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>    <span class="n">beam_score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>        <span class="n">beam_num_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">look_ahead</span><span class="p">))</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>    <span class="k">for</span> <span class="n">cluster_seq</span><span class="p">,</span> <span class="n">_</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">ndenumerate</span><span class="p">(</span><span class="n">beam_score_set</span><span class="p">):</span>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>      <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>                                                   <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>      <span class="n">beam_score_set</span><span class="p">[</span><span class="n">cluster_seq</span><span class="p">]</span> <span class="o">=</span> <span class="n">updated_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span>
+</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>    <span class="k">return</span> <span class="n">beam_score_set</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>
+</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a><span class="sd">    Args:</span>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a><span class="sd">        - `N`: length of one test utterance.</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a><span class="sd">        - `D` : observation dimension.</span>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a><span class="sd">        For example:</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a><span class="sd">      ```</span>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a><span class="sd">      test_sequence =</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
+</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a><span class="sd">      ```</span>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a><span class="sd">    Returns:</span>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a><span class="sd">        an array of integers, of size `N`.</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a><span class="sd">    Raises:</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>    <span class="c1"># check type</span>
+</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>    <span class="c1"># check dimension</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>    <span class="c1"># check size</span>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>    <span class="c1"># bookkeeping for beam search</span>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
+</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
+</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>      <span class="c1"># find top scores</span>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a><span class="sd">    Args:</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a><span class="sd">    Returns:</span>
+</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>
+</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a><span class="sd">           be a 1-dim list of strings</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a><span class="sd">    Raises:</span>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>    <span class="c1"># check type</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
 </span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>
-</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a><span class="k">def</span> <span class="nf">parallel_predict</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">num_processes</span><span class="o">=</span><span class="mi">4</span><span class="p">):</span>
-</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Run prediction in parallel using torch.multiprocessing.</span>
-</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>
-</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a><span class="sd">  This is a beta feature. It makes prediction slower on CPU. But it&#39;s reported</span>
-</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a><span class="sd">  that it makes prediction faster on GPU.</span>
-</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>
-</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a><span class="sd">  Args:</span>
-</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a><span class="sd">    model: instance of UISRNN model</span>
-</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a><span class="sd">    test_sequences: a list of test sequences, or a single test</span>
-</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a><span class="sd">      sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a><span class="sd">      of real numbers. See `predict_single()` for details.</span>
-</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a><span class="sd">    args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a><span class="sd">    num_processes: number of parallel processes.</span>
-</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>
-</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a><span class="sd">  Returns:</span>
-</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a><span class="sd">    a list of the same size as test_sequences, where each element</span>
-</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a><span class="sd">    being a 1-dim list of strings.</span>
-</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>
-</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a><span class="sd">  Raises:</span>
-</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences must be a list.&#39;</span><span class="p">)</span>
-</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>  <span class="n">ctx</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">get_context</span><span class="p">(</span><span class="s1">&#39;forkserver&#39;</span><span class="p">)</span>
-</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>  <span class="n">model</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">share_memory</span><span class="p">()</span>
-</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>  <span class="n">pool</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">num_processes</span><span class="p">)</span>
-</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>  <span class="n">results</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>      <span class="n">functools</span><span class="o">.</span><span class="n">partial</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">predict_single</span><span class="p">,</span> <span class="n">args</span><span class="o">=</span><span class="n">args</span><span class="p">),</span>
-</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>      <span class="n">test_sequences</span><span class="p">)</span>
-</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>  <span class="n">pool</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
-</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>  <span class="k">return</span> <span class="n">results</span>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a><span class="k">def</span> <span class="nf">parallel_predict</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">num_processes</span><span class="o">=</span><span class="mi">4</span><span class="p">):</span>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Run prediction in parallel using torch.multiprocessing.</span>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a><span class="sd">  This is a beta feature. It makes prediction slower on CPU. But it&#39;s reported</span>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a><span class="sd">  that it makes prediction faster on GPU.</span>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a><span class="sd">  Args:</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a><span class="sd">    model: instance of UISRNN model</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a><span class="sd">    test_sequences: a list of test sequences, or a single test</span>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a><span class="sd">      sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a><span class="sd">      of real numbers. See `predict_single()` for details.</span>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a><span class="sd">    args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a><span class="sd">    num_processes: number of parallel processes.</span>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a><span class="sd">  Returns:</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a><span class="sd">    a list of the same size as test_sequences, where each element</span>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a><span class="sd">    being a 1-dim list of strings.</span>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a><span class="sd">  Raises:</span>
+</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences must be a list.&#39;</span><span class="p">)</span>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>  <span class="n">ctx</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">get_context</span><span class="p">(</span><span class="s1">&#39;forkserver&#39;</span><span class="p">)</span>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>  <span class="n">model</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">share_memory</span><span class="p">()</span>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>  <span class="n">pool</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">num_processes</span><span class="p">)</span>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>  <span class="n">results</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>      <span class="n">functools</span><span class="o">.</span><span class="n">partial</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">predict_single</span><span class="p">,</span> <span class="n">args</span><span class="o">=</span><span class="n">args</span><span class="p">),</span>
+</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>      <span class="n">test_sequences</span><span class="p">)</span>
+</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>  <span class="n">pool</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>  <span class="k">return</span> <span class="n">results</span>
 </span></pre></div>
 
 
@@ -786,27 +787,27 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#CoreRNN"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CoreRNN-32"><a href="#CoreRNN-32"><span class="linenos">32</span></a><span class="k">class</span> <span class="nc">CoreRNN</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
-</span><span id="CoreRNN-33"><a href="#CoreRNN-33"><span class="linenos">33</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;The core Recurent Neural Network used by UIS-RNN.&quot;&quot;&quot;</span>
-</span><span id="CoreRNN-34"><a href="#CoreRNN-34"><span class="linenos">34</span></a>
-</span><span id="CoreRNN-35"><a href="#CoreRNN-35"><span class="linenos">35</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
-</span><span id="CoreRNN-36"><a href="#CoreRNN-36"><span class="linenos">36</span></a>    <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-</span><span id="CoreRNN-37"><a href="#CoreRNN-37"><span class="linenos">37</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span> <span class="o">=</span> <span class="n">hidden_size</span>
-</span><span id="CoreRNN-38"><a href="#CoreRNN-38"><span class="linenos">38</span></a>    <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="CoreRNN-39"><a href="#CoreRNN-39"><span class="linenos">39</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="n">dropout</span><span class="p">)</span>
-</span><span id="CoreRNN-40"><a href="#CoreRNN-40"><span class="linenos">40</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="CoreRNN-41"><a href="#CoreRNN-41"><span class="linenos">41</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">)</span>
-</span><span id="CoreRNN-42"><a href="#CoreRNN-42"><span class="linenos">42</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">)</span>
-</span><span id="CoreRNN-43"><a href="#CoreRNN-43"><span class="linenos">43</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="CoreRNN-44"><a href="#CoreRNN-44"><span class="linenos">44</span></a>
-</span><span id="CoreRNN-45"><a href="#CoreRNN-45"><span class="linenos">45</span></a>  <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="CoreRNN-46"><a href="#CoreRNN-46"><span class="linenos">46</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The forward function of the module.&quot;&quot;&quot;</span>
-</span><span id="CoreRNN-47"><a href="#CoreRNN-47"><span class="linenos">47</span></a>    <span class="n">output_seq</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gru</span><span class="p">(</span><span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="CoreRNN-48"><a href="#CoreRNN-48"><span class="linenos">48</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_seq</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">PackedSequence</span><span class="p">):</span>
-</span><span id="CoreRNN-49"><a href="#CoreRNN-49"><span class="linenos">49</span></a>      <span class="n">output_seq</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pad_packed_sequence</span><span class="p">(</span>
-</span><span id="CoreRNN-50"><a href="#CoreRNN-50"><span class="linenos">50</span></a>          <span class="n">output_seq</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="CoreRNN-51"><a href="#CoreRNN-51"><span class="linenos">51</span></a>    <span class="n">mean</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span><span class="p">(</span><span class="n">F</span><span class="o">.</span><span class="n">relu</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span><span class="p">(</span><span class="n">output_seq</span><span class="p">)))</span>
-</span><span id="CoreRNN-52"><a href="#CoreRNN-52"><span class="linenos">52</span></a>    <span class="k">return</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CoreRNN-33"><a href="#CoreRNN-33"><span class="linenos">33</span></a><span class="k">class</span> <span class="nc">CoreRNN</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+</span><span id="CoreRNN-34"><a href="#CoreRNN-34"><span class="linenos">34</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;The core Recurent Neural Network used by UIS-RNN.&quot;&quot;&quot;</span>
+</span><span id="CoreRNN-35"><a href="#CoreRNN-35"><span class="linenos">35</span></a>
+</span><span id="CoreRNN-36"><a href="#CoreRNN-36"><span class="linenos">36</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
+</span><span id="CoreRNN-37"><a href="#CoreRNN-37"><span class="linenos">37</span></a>    <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="CoreRNN-38"><a href="#CoreRNN-38"><span class="linenos">38</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span> <span class="o">=</span> <span class="n">hidden_size</span>
+</span><span id="CoreRNN-39"><a href="#CoreRNN-39"><span class="linenos">39</span></a>    <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CoreRNN-40"><a href="#CoreRNN-40"><span class="linenos">40</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="n">dropout</span><span class="p">)</span>
+</span><span id="CoreRNN-41"><a href="#CoreRNN-41"><span class="linenos">41</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="CoreRNN-42"><a href="#CoreRNN-42"><span class="linenos">42</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">)</span>
+</span><span id="CoreRNN-43"><a href="#CoreRNN-43"><span class="linenos">43</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">)</span>
+</span><span id="CoreRNN-44"><a href="#CoreRNN-44"><span class="linenos">44</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="CoreRNN-45"><a href="#CoreRNN-45"><span class="linenos">45</span></a>
+</span><span id="CoreRNN-46"><a href="#CoreRNN-46"><span class="linenos">46</span></a>  <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="CoreRNN-47"><a href="#CoreRNN-47"><span class="linenos">47</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The forward function of the module.&quot;&quot;&quot;</span>
+</span><span id="CoreRNN-48"><a href="#CoreRNN-48"><span class="linenos">48</span></a>    <span class="n">output_seq</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gru</span><span class="p">(</span><span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="CoreRNN-49"><a href="#CoreRNN-49"><span class="linenos">49</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_seq</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">PackedSequence</span><span class="p">):</span>
+</span><span id="CoreRNN-50"><a href="#CoreRNN-50"><span class="linenos">50</span></a>      <span class="n">output_seq</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pad_packed_sequence</span><span class="p">(</span>
+</span><span id="CoreRNN-51"><a href="#CoreRNN-51"><span class="linenos">51</span></a>          <span class="n">output_seq</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CoreRNN-52"><a href="#CoreRNN-52"><span class="linenos">52</span></a>    <span class="n">mean</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span><span class="p">(</span><span class="n">F</span><span class="o">.</span><span class="n">relu</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span><span class="p">(</span><span class="n">output_seq</span><span class="p">)))</span>
+</span><span id="CoreRNN-53"><a href="#CoreRNN-53"><span class="linenos">53</span></a>    <span class="k">return</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span>
 </span></pre></div>
 
 
@@ -824,19 +825,19 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#CoreRNN.__init__"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CoreRNN.__init__-35"><a href="#CoreRNN.__init__-35"><span class="linenos">35</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
-</span><span id="CoreRNN.__init__-36"><a href="#CoreRNN.__init__-36"><span class="linenos">36</span></a>    <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-</span><span id="CoreRNN.__init__-37"><a href="#CoreRNN.__init__-37"><span class="linenos">37</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span> <span class="o">=</span> <span class="n">hidden_size</span>
-</span><span id="CoreRNN.__init__-38"><a href="#CoreRNN.__init__-38"><span class="linenos">38</span></a>    <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="CoreRNN.__init__-39"><a href="#CoreRNN.__init__-39"><span class="linenos">39</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="n">dropout</span><span class="p">)</span>
-</span><span id="CoreRNN.__init__-40"><a href="#CoreRNN.__init__-40"><span class="linenos">40</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="CoreRNN.__init__-41"><a href="#CoreRNN.__init__-41"><span class="linenos">41</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">)</span>
-</span><span id="CoreRNN.__init__-42"><a href="#CoreRNN.__init__-42"><span class="linenos">42</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">)</span>
-</span><span id="CoreRNN.__init__-43"><a href="#CoreRNN.__init__-43"><span class="linenos">43</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CoreRNN.__init__-36"><a href="#CoreRNN.__init__-36"><span class="linenos">36</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
+</span><span id="CoreRNN.__init__-37"><a href="#CoreRNN.__init__-37"><span class="linenos">37</span></a>    <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="CoreRNN.__init__-38"><a href="#CoreRNN.__init__-38"><span class="linenos">38</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_size</span> <span class="o">=</span> <span class="n">hidden_size</span>
+</span><span id="CoreRNN.__init__-39"><a href="#CoreRNN.__init__-39"><span class="linenos">39</span></a>    <span class="k">if</span> <span class="n">depth</span> <span class="o">&gt;=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CoreRNN.__init__-40"><a href="#CoreRNN.__init__-40"><span class="linenos">40</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">dropout</span><span class="o">=</span><span class="n">dropout</span><span class="p">)</span>
+</span><span id="CoreRNN.__init__-41"><a href="#CoreRNN.__init__-41"><span class="linenos">41</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="CoreRNN.__init__-42"><a href="#CoreRNN.__init__-42"><span class="linenos">42</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">gru</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">GRU</span><span class="p">(</span><span class="n">input_dim</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">,</span> <span class="n">depth</span><span class="p">)</span>
+</span><span id="CoreRNN.__init__-43"><a href="#CoreRNN.__init__-43"><span class="linenos">43</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">hidden_size</span><span class="p">)</span>
+</span><span id="CoreRNN.__init__-44"><a href="#CoreRNN.__init__-44"><span class="linenos">44</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
 </span></pre></div>
 
 
-            <div class="docstring"><p>Initializes internal Module state, shared by both nn.Module and ScriptModule.</p>
+            <div class="docstring"><p>Initialize internal Module state, shared by both nn.Module and ScriptModule.</p>
 </div>
 
 
@@ -885,14 +886,14 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#CoreRNN.forward"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CoreRNN.forward-45"><a href="#CoreRNN.forward-45"><span class="linenos">45</span></a>  <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="CoreRNN.forward-46"><a href="#CoreRNN.forward-46"><span class="linenos">46</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The forward function of the module.&quot;&quot;&quot;</span>
-</span><span id="CoreRNN.forward-47"><a href="#CoreRNN.forward-47"><span class="linenos">47</span></a>    <span class="n">output_seq</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gru</span><span class="p">(</span><span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="CoreRNN.forward-48"><a href="#CoreRNN.forward-48"><span class="linenos">48</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_seq</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">PackedSequence</span><span class="p">):</span>
-</span><span id="CoreRNN.forward-49"><a href="#CoreRNN.forward-49"><span class="linenos">49</span></a>      <span class="n">output_seq</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pad_packed_sequence</span><span class="p">(</span>
-</span><span id="CoreRNN.forward-50"><a href="#CoreRNN.forward-50"><span class="linenos">50</span></a>          <span class="n">output_seq</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="CoreRNN.forward-51"><a href="#CoreRNN.forward-51"><span class="linenos">51</span></a>    <span class="n">mean</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span><span class="p">(</span><span class="n">F</span><span class="o">.</span><span class="n">relu</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span><span class="p">(</span><span class="n">output_seq</span><span class="p">)))</span>
-</span><span id="CoreRNN.forward-52"><a href="#CoreRNN.forward-52"><span class="linenos">52</span></a>    <span class="k">return</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CoreRNN.forward-46"><a href="#CoreRNN.forward-46"><span class="linenos">46</span></a>  <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="CoreRNN.forward-47"><a href="#CoreRNN.forward-47"><span class="linenos">47</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The forward function of the module.&quot;&quot;&quot;</span>
+</span><span id="CoreRNN.forward-48"><a href="#CoreRNN.forward-48"><span class="linenos">48</span></a>    <span class="n">output_seq</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gru</span><span class="p">(</span><span class="n">input_seq</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="CoreRNN.forward-49"><a href="#CoreRNN.forward-49"><span class="linenos">49</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_seq</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">PackedSequence</span><span class="p">):</span>
+</span><span id="CoreRNN.forward-50"><a href="#CoreRNN.forward-50"><span class="linenos">50</span></a>      <span class="n">output_seq</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pad_packed_sequence</span><span class="p">(</span>
+</span><span id="CoreRNN.forward-51"><a href="#CoreRNN.forward-51"><span class="linenos">51</span></a>          <span class="n">output_seq</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CoreRNN.forward-52"><a href="#CoreRNN.forward-52"><span class="linenos">52</span></a>    <span class="n">mean</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">linear_mean2</span><span class="p">(</span><span class="n">F</span><span class="o">.</span><span class="n">relu</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">linear_mean1</span><span class="p">(</span><span class="n">output_seq</span><span class="p">)))</span>
+</span><span id="CoreRNN.forward-53"><a href="#CoreRNN.forward-53"><span class="linenos">53</span></a>    <span class="k">return</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span>
 </span></pre></div>
 
 
@@ -952,6 +953,7 @@ <h5>Inherited Members</h5>
                 <dd id="CoreRNN.zero_grad" class="function">zero_grad</dd>
                 <dd id="CoreRNN.share_memory" class="function">share_memory</dd>
                 <dd id="CoreRNN.extra_repr" class="function">extra_repr</dd>
+                <dd id="CoreRNN.compile" class="function">compile</dd>
 
             </div>
                                 </dl>
@@ -968,29 +970,29 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#BeamState"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="BeamState-55"><a href="#BeamState-55"><span class="linenos">55</span></a><span class="k">class</span> <span class="nc">BeamState</span><span class="p">:</span>
-</span><span id="BeamState-56"><a href="#BeamState-56"><span class="linenos">56</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Structure that contains necessary states for beam search.&quot;&quot;&quot;</span>
-</span><span id="BeamState-57"><a href="#BeamState-57"><span class="linenos">57</span></a>
-</span><span id="BeamState-58"><a href="#BeamState-58"><span class="linenos">58</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">source</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="BeamState-59"><a href="#BeamState-59"><span class="linenos">59</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">source</span><span class="p">:</span>
-</span><span id="BeamState-60"><a href="#BeamState-60"><span class="linenos">60</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState-61"><a href="#BeamState-61"><span class="linenos">61</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState-62"><a href="#BeamState-62"><span class="linenos">62</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="BeamState-63"><a href="#BeamState-63"><span class="linenos">63</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState-64"><a href="#BeamState-64"><span class="linenos">64</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState-65"><a href="#BeamState-65"><span class="linenos">65</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="BeamState-66"><a href="#BeamState-66"><span class="linenos">66</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState-67"><a href="#BeamState-67"><span class="linenos">67</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState-68"><a href="#BeamState-68"><span class="linenos">68</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState-69"><a href="#BeamState-69"><span class="linenos">69</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState-70"><a href="#BeamState-70"><span class="linenos">70</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">neg_likelihood</span>
-</span><span id="BeamState-71"><a href="#BeamState-71"><span class="linenos">71</span></a>
-</span><span id="BeamState-72"><a href="#BeamState-72"><span class="linenos">72</span></a>  <span class="k">def</span> <span class="nf">append</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">):</span>
-</span><span id="BeamState-73"><a href="#BeamState-73"><span class="linenos">73</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Append new item to the BeamState.&quot;&quot;&quot;</span>
-</span><span id="BeamState-74"><a href="#BeamState-74"><span class="linenos">74</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
-</span><span id="BeamState-75"><a href="#BeamState-75"><span class="linenos">75</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
-</span><span id="BeamState-76"><a href="#BeamState-76"><span class="linenos">76</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="BeamState-77"><a href="#BeamState-77"><span class="linenos">77</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="BeamState-56"><a href="#BeamState-56"><span class="linenos">56</span></a><span class="k">class</span> <span class="nc">BeamState</span><span class="p">:</span>
+</span><span id="BeamState-57"><a href="#BeamState-57"><span class="linenos">57</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Structure that contains necessary states for beam search.&quot;&quot;&quot;</span>
+</span><span id="BeamState-58"><a href="#BeamState-58"><span class="linenos">58</span></a>
+</span><span id="BeamState-59"><a href="#BeamState-59"><span class="linenos">59</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">source</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="BeamState-60"><a href="#BeamState-60"><span class="linenos">60</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">source</span><span class="p">:</span>
+</span><span id="BeamState-61"><a href="#BeamState-61"><span class="linenos">61</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState-62"><a href="#BeamState-62"><span class="linenos">62</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState-63"><a href="#BeamState-63"><span class="linenos">63</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="BeamState-64"><a href="#BeamState-64"><span class="linenos">64</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState-65"><a href="#BeamState-65"><span class="linenos">65</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState-66"><a href="#BeamState-66"><span class="linenos">66</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="BeamState-67"><a href="#BeamState-67"><span class="linenos">67</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState-68"><a href="#BeamState-68"><span class="linenos">68</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState-69"><a href="#BeamState-69"><span class="linenos">69</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState-70"><a href="#BeamState-70"><span class="linenos">70</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState-71"><a href="#BeamState-71"><span class="linenos">71</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">neg_likelihood</span>
+</span><span id="BeamState-72"><a href="#BeamState-72"><span class="linenos">72</span></a>
+</span><span id="BeamState-73"><a href="#BeamState-73"><span class="linenos">73</span></a>  <span class="k">def</span> <span class="nf">append</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">):</span>
+</span><span id="BeamState-74"><a href="#BeamState-74"><span class="linenos">74</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Append new item to the BeamState.&quot;&quot;&quot;</span>
+</span><span id="BeamState-75"><a href="#BeamState-75"><span class="linenos">75</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
+</span><span id="BeamState-76"><a href="#BeamState-76"><span class="linenos">76</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
+</span><span id="BeamState-77"><a href="#BeamState-77"><span class="linenos">77</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="BeamState-78"><a href="#BeamState-78"><span class="linenos">78</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1008,19 +1010,19 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#BeamState.__init__"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="BeamState.__init__-58"><a href="#BeamState.__init__-58"><span class="linenos">58</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">source</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="BeamState.__init__-59"><a href="#BeamState.__init__-59"><span class="linenos">59</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">source</span><span class="p">:</span>
-</span><span id="BeamState.__init__-60"><a href="#BeamState.__init__-60"><span class="linenos">60</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState.__init__-61"><a href="#BeamState.__init__-61"><span class="linenos">61</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState.__init__-62"><a href="#BeamState.__init__-62"><span class="linenos">62</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="BeamState.__init__-63"><a href="#BeamState.__init__-63"><span class="linenos">63</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState.__init__-64"><a href="#BeamState.__init__-64"><span class="linenos">64</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="BeamState.__init__-65"><a href="#BeamState.__init__-65"><span class="linenos">65</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="BeamState.__init__-66"><a href="#BeamState.__init__-66"><span class="linenos">66</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState.__init__-67"><a href="#BeamState.__init__-67"><span class="linenos">67</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState.__init__-68"><a href="#BeamState.__init__-68"><span class="linenos">68</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState.__init__-69"><a href="#BeamState.__init__-69"><span class="linenos">69</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="BeamState.__init__-70"><a href="#BeamState.__init__-70"><span class="linenos">70</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">neg_likelihood</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="BeamState.__init__-59"><a href="#BeamState.__init__-59"><span class="linenos">59</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">source</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="BeamState.__init__-60"><a href="#BeamState.__init__-60"><span class="linenos">60</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">source</span><span class="p">:</span>
+</span><span id="BeamState.__init__-61"><a href="#BeamState.__init__-61"><span class="linenos">61</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState.__init__-62"><a href="#BeamState.__init__-62"><span class="linenos">62</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState.__init__-63"><a href="#BeamState.__init__-63"><span class="linenos">63</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="BeamState.__init__-64"><a href="#BeamState.__init__-64"><span class="linenos">64</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState.__init__-65"><a href="#BeamState.__init__-65"><span class="linenos">65</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="BeamState.__init__-66"><a href="#BeamState.__init__-66"><span class="linenos">66</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="BeamState.__init__-67"><a href="#BeamState.__init__-67"><span class="linenos">67</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState.__init__-68"><a href="#BeamState.__init__-68"><span class="linenos">68</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState.__init__-69"><a href="#BeamState.__init__-69"><span class="linenos">69</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">trace</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState.__init__-70"><a href="#BeamState.__init__-70"><span class="linenos">70</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="BeamState.__init__-71"><a href="#BeamState.__init__-71"><span class="linenos">71</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="n">source</span><span class="o">.</span><span class="n">neg_likelihood</span>
 </span></pre></div>
 
 
@@ -1038,12 +1040,12 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#BeamState.append"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="BeamState.append-72"><a href="#BeamState.append-72"><span class="linenos">72</span></a>  <span class="k">def</span> <span class="nf">append</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">):</span>
-</span><span id="BeamState.append-73"><a href="#BeamState.append-73"><span class="linenos">73</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Append new item to the BeamState.&quot;&quot;&quot;</span>
-</span><span id="BeamState.append-74"><a href="#BeamState.append-74"><span class="linenos">74</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
-</span><span id="BeamState.append-75"><a href="#BeamState.append-75"><span class="linenos">75</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
-</span><span id="BeamState.append-76"><a href="#BeamState.append-76"><span class="linenos">76</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="BeamState.append-77"><a href="#BeamState.append-77"><span class="linenos">77</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="BeamState.append-73"><a href="#BeamState.append-73"><span class="linenos">73</span></a>  <span class="k">def</span> <span class="nf">append</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">):</span>
+</span><span id="BeamState.append-74"><a href="#BeamState.append-74"><span class="linenos">74</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Append new item to the BeamState.&quot;&quot;&quot;</span>
+</span><span id="BeamState.append-75"><a href="#BeamState.append-75"><span class="linenos">75</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">mean_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
+</span><span id="BeamState.append-76"><a href="#BeamState.append-76"><span class="linenos">76</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">hidden_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span>
+</span><span id="BeamState.append-77"><a href="#BeamState.append-77"><span class="linenos">77</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">block_counts</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="BeamState.append-78"><a href="#BeamState.append-78"><span class="linenos">78</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1064,517 +1066,517 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN-80"><a href="#UISRNN-80"><span class="linenos"> 80</span></a><span class="k">class</span> <span class="nc">UISRNN</span><span class="p">:</span>
-</span><span id="UISRNN-81"><a href="#UISRNN-81"><span class="linenos"> 81</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Unbounded Interleaved-State Recurrent Neural Networks.&quot;&quot;&quot;</span>
-</span><span id="UISRNN-82"><a href="#UISRNN-82"><span class="linenos"> 82</span></a>
-</span><span id="UISRNN-83"><a href="#UISRNN-83"><span class="linenos"> 83</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-84"><a href="#UISRNN-84"><span class="linenos"> 84</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
-</span><span id="UISRNN-85"><a href="#UISRNN-85"><span class="linenos"> 85</span></a>
-</span><span id="UISRNN-86"><a href="#UISRNN-86"><span class="linenos"> 86</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-87"><a href="#UISRNN-87"><span class="linenos"> 87</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-88"><a href="#UISRNN-88"><span class="linenos"> 88</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-89"><a href="#UISRNN-89"><span class="linenos"> 89</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
-</span><span id="UISRNN-90"><a href="#UISRNN-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
-</span><span id="UISRNN-91"><a href="#UISRNN-91"><span class="linenos"> 91</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-92"><a href="#UISRNN-92"><span class="linenos"> 92</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="UISRNN-93"><a href="#UISRNN-93"><span class="linenos"> 93</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN-94"><a href="#UISRNN-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-95"><a href="#UISRNN-95"><span class="linenos"> 95</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-96"><a href="#UISRNN-96"><span class="linenos"> 96</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-97"><a href="#UISRNN-97"><span class="linenos"> 97</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
-</span><span id="UISRNN-98"><a href="#UISRNN-98"><span class="linenos"> 98</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-99"><a href="#UISRNN-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-100"><a href="#UISRNN-100"><span class="linenos">100</span></a>    <span class="c1"># initial values of variables</span>
-</span><span id="UISRNN-101"><a href="#UISRNN-101"><span class="linenos">101</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="UISRNN-102"><a href="#UISRNN-102"><span class="linenos">102</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-103"><a href="#UISRNN-103"><span class="linenos">103</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-104"><a href="#UISRNN-104"><span class="linenos">104</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
-</span><span id="UISRNN-105"><a href="#UISRNN-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="UISRNN-106"><a href="#UISRNN-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
-</span><span id="UISRNN-107"><a href="#UISRNN-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
-</span><span id="UISRNN-108"><a href="#UISRNN-108"><span class="linenos">108</span></a>
-</span><span id="UISRNN-109"><a href="#UISRNN-109"><span class="linenos">109</span></a>  <span class="k">def</span> <span class="nf">_get_optimizer</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">optimizer</span><span class="p">,</span> <span class="n">learning_rate</span><span class="p">):</span>
-</span><span id="UISRNN-110"><a href="#UISRNN-110"><span class="linenos">110</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Get optimizer for UISRNN.</span>
-</span><span id="UISRNN-111"><a href="#UISRNN-111"><span class="linenos">111</span></a>
-</span><span id="UISRNN-112"><a href="#UISRNN-112"><span class="linenos">112</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-113"><a href="#UISRNN-113"><span class="linenos">113</span></a><span class="sd">      optimizer: string - name of the optimizer.</span>
-</span><span id="UISRNN-114"><a href="#UISRNN-114"><span class="linenos">114</span></a><span class="sd">      learning_rate: - learning rate for the entire model.</span>
-</span><span id="UISRNN-115"><a href="#UISRNN-115"><span class="linenos">115</span></a><span class="sd">        We do not customize learning rate for separate parts.</span>
-</span><span id="UISRNN-116"><a href="#UISRNN-116"><span class="linenos">116</span></a>
-</span><span id="UISRNN-117"><a href="#UISRNN-117"><span class="linenos">117</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-118"><a href="#UISRNN-118"><span class="linenos">118</span></a><span class="sd">      a pytorch &quot;optim&quot; object</span>
-</span><span id="UISRNN-119"><a href="#UISRNN-119"><span class="linenos">119</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-120"><a href="#UISRNN-120"><span class="linenos">120</span></a>    <span class="n">params</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="UISRNN-121"><a href="#UISRNN-121"><span class="linenos">121</span></a>        <span class="p">{</span>
-</span><span id="UISRNN-122"><a href="#UISRNN-122"><span class="linenos">122</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
-</span><span id="UISRNN-123"><a href="#UISRNN-123"><span class="linenos">123</span></a>        <span class="p">},</span>  <span class="c1"># rnn parameters</span>
-</span><span id="UISRNN-124"><a href="#UISRNN-124"><span class="linenos">124</span></a>        <span class="p">{</span>
-</span><span id="UISRNN-125"><a href="#UISRNN-125"><span class="linenos">125</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span>
-</span><span id="UISRNN-126"><a href="#UISRNN-126"><span class="linenos">126</span></a>        <span class="p">}</span>  <span class="c1"># rnn initial hidden state</span>
-</span><span id="UISRNN-127"><a href="#UISRNN-127"><span class="linenos">127</span></a>    <span class="p">]</span>
-</span><span id="UISRNN-128"><a href="#UISRNN-128"><span class="linenos">128</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span><span class="p">:</span>  <span class="c1"># train sigma2</span>
-</span><span id="UISRNN-129"><a href="#UISRNN-129"><span class="linenos">129</span></a>      <span class="n">params</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="UISRNN-130"><a href="#UISRNN-130"><span class="linenos">130</span></a>          <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="UISRNN-131"><a href="#UISRNN-131"><span class="linenos">131</span></a>      <span class="p">})</span>  <span class="c1"># variance parameters</span>
-</span><span id="UISRNN-132"><a href="#UISRNN-132"><span class="linenos">132</span></a>    <span class="k">assert</span> <span class="n">optimizer</span> <span class="o">==</span> <span class="s1">&#39;adam&#39;</span><span class="p">,</span> <span class="s1">&#39;Only adam optimizer is supported.&#39;</span>
-</span><span id="UISRNN-133"><a href="#UISRNN-133"><span class="linenos">133</span></a>    <span class="k">return</span> <span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="UISRNN-134"><a href="#UISRNN-134"><span class="linenos">134</span></a>
-</span><span id="UISRNN-135"><a href="#UISRNN-135"><span class="linenos">135</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN-136"><a href="#UISRNN-136"><span class="linenos">136</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
-</span><span id="UISRNN-137"><a href="#UISRNN-137"><span class="linenos">137</span></a>
-</span><span id="UISRNN-138"><a href="#UISRNN-138"><span class="linenos">138</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-139"><a href="#UISRNN-139"><span class="linenos">139</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN-140"><a href="#UISRNN-140"><span class="linenos">140</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-141"><a href="#UISRNN-141"><span class="linenos">141</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
-</span><span id="UISRNN-142"><a href="#UISRNN-142"><span class="linenos">142</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
-</span><span id="UISRNN-143"><a href="#UISRNN-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
-</span><span id="UISRNN-144"><a href="#UISRNN-144"><span class="linenos">144</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN-145"><a href="#UISRNN-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
-</span><span id="UISRNN-146"><a href="#UISRNN-146"><span class="linenos">146</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="UISRNN-147"><a href="#UISRNN-147"><span class="linenos">147</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
-</span><span id="UISRNN-148"><a href="#UISRNN-148"><span class="linenos">148</span></a>
-</span><span id="UISRNN-149"><a href="#UISRNN-149"><span class="linenos">149</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN-150"><a href="#UISRNN-150"><span class="linenos">150</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
-</span><span id="UISRNN-151"><a href="#UISRNN-151"><span class="linenos">151</span></a>
-</span><span id="UISRNN-152"><a href="#UISRNN-152"><span class="linenos">152</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-153"><a href="#UISRNN-153"><span class="linenos">153</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN-154"><a href="#UISRNN-154"><span class="linenos">154</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-155"><a href="#UISRNN-155"><span class="linenos">155</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
-</span><span id="UISRNN-156"><a href="#UISRNN-156"><span class="linenos">156</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-157"><a href="#UISRNN-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-158"><a href="#UISRNN-158"><span class="linenos">158</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-159"><a href="#UISRNN-159"><span class="linenos">159</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-160"><a href="#UISRNN-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
-</span><span id="UISRNN-161"><a href="#UISRNN-161"><span class="linenos">161</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-162"><a href="#UISRNN-162"><span class="linenos">162</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
-</span><span id="UISRNN-163"><a href="#UISRNN-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN-164"><a href="#UISRNN-164"><span class="linenos">164</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN-165"><a href="#UISRNN-165"><span class="linenos">165</span></a>
-</span><span id="UISRNN-166"><a href="#UISRNN-166"><span class="linenos">166</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-167"><a href="#UISRNN-167"><span class="linenos">167</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
-</span><span id="UISRNN-168"><a href="#UISRNN-168"><span class="linenos">168</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN-169"><a href="#UISRNN-169"><span class="linenos">169</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
-</span><span id="UISRNN-170"><a href="#UISRNN-170"><span class="linenos">170</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
-</span><span id="UISRNN-171"><a href="#UISRNN-171"><span class="linenos">171</span></a>
-</span><span id="UISRNN-172"><a href="#UISRNN-172"><span class="linenos">172</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-173"><a href="#UISRNN-173"><span class="linenos">173</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
-</span><span id="UISRNN-174"><a href="#UISRNN-174"><span class="linenos">174</span></a>
-</span><span id="UISRNN-175"><a href="#UISRNN-175"><span class="linenos">175</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-176"><a href="#UISRNN-176"><span class="linenos">176</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
-</span><span id="UISRNN-177"><a href="#UISRNN-177"><span class="linenos">177</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN-178"><a href="#UISRNN-178"><span class="linenos">178</span></a>
-</span><span id="UISRNN-179"><a href="#UISRNN-179"><span class="linenos">179</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
-</span><span id="UISRNN-180"><a href="#UISRNN-180"><span class="linenos">180</span></a><span class="sd">        - `D`: observation dimension.</span>
-</span><span id="UISRNN-181"><a href="#UISRNN-181"><span class="linenos">181</span></a>
-</span><span id="UISRNN-182"><a href="#UISRNN-182"><span class="linenos">182</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN-183"><a href="#UISRNN-183"><span class="linenos">183</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-184"><a href="#UISRNN-184"><span class="linenos">184</span></a><span class="sd">      train_sequence =</span>
-</span><span id="UISRNN-185"><a href="#UISRNN-185"><span class="linenos">185</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN-186"><a href="#UISRNN-186"><span class="linenos">186</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN-187"><a href="#UISRNN-187"><span class="linenos">187</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN-188"><a href="#UISRNN-188"><span class="linenos">188</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN-189"><a href="#UISRNN-189"><span class="linenos">189</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN-190"><a href="#UISRNN-190"><span class="linenos">190</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-191"><a href="#UISRNN-191"><span class="linenos">191</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN-192"><a href="#UISRNN-192"><span class="linenos">192</span></a>
-</span><span id="UISRNN-193"><a href="#UISRNN-193"><span class="linenos">193</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
-</span><span id="UISRNN-194"><a href="#UISRNN-194"><span class="linenos">194</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
-</span><span id="UISRNN-195"><a href="#UISRNN-195"><span class="linenos">195</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
-</span><span id="UISRNN-196"><a href="#UISRNN-196"><span class="linenos">196</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN-197"><a href="#UISRNN-197"><span class="linenos">197</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-198"><a href="#UISRNN-198"><span class="linenos">198</span></a><span class="sd">      train_cluster_id =</span>
-</span><span id="UISRNN-199"><a href="#UISRNN-199"><span class="linenos">199</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
-</span><span id="UISRNN-200"><a href="#UISRNN-200"><span class="linenos">200</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-201"><a href="#UISRNN-201"><span class="linenos">201</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
-</span><span id="UISRNN-202"><a href="#UISRNN-202"><span class="linenos">202</span></a>
-</span><span id="UISRNN-203"><a href="#UISRNN-203"><span class="linenos">203</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
-</span><span id="UISRNN-204"><a href="#UISRNN-204"><span class="linenos">204</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
-</span><span id="UISRNN-205"><a href="#UISRNN-205"><span class="linenos">205</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-206"><a href="#UISRNN-206"><span class="linenos">206</span></a>
-</span><span id="UISRNN-207"><a href="#UISRNN-207"><span class="linenos">207</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-208"><a href="#UISRNN-208"><span class="linenos">208</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
-</span><span id="UISRNN-209"><a href="#UISRNN-209"><span class="linenos">209</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
-</span><span id="UISRNN-210"><a href="#UISRNN-210"><span class="linenos">210</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-211"><a href="#UISRNN-211"><span class="linenos">211</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN-212"><a href="#UISRNN-212"><span class="linenos">212</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN-213"><a href="#UISRNN-213"><span class="linenos">213</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN-214"><a href="#UISRNN-214"><span class="linenos">214</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-215"><a href="#UISRNN-215"><span class="linenos">215</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN-216"><a href="#UISRNN-216"><span class="linenos">216</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
-</span><span id="UISRNN-217"><a href="#UISRNN-217"><span class="linenos">217</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN-218"><a href="#UISRNN-218"><span class="linenos">218</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
-</span><span id="UISRNN-219"><a href="#UISRNN-219"><span class="linenos">219</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-220"><a href="#UISRNN-220"><span class="linenos">220</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN-221"><a href="#UISRNN-221"><span class="linenos">221</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN-222"><a href="#UISRNN-222"><span class="linenos">222</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-223"><a href="#UISRNN-223"><span class="linenos">223</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="UISRNN-224"><a href="#UISRNN-224"><span class="linenos">224</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-225"><a href="#UISRNN-225"><span class="linenos">225</span></a>    <span class="c1"># check length and size</span>
-</span><span id="UISRNN-226"><a href="#UISRNN-226"><span class="linenos">226</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN-227"><a href="#UISRNN-227"><span class="linenos">227</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN-228"><a href="#UISRNN-228"><span class="linenos">228</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN-229"><a href="#UISRNN-229"><span class="linenos">229</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-230"><a href="#UISRNN-230"><span class="linenos">230</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
-</span><span id="UISRNN-231"><a href="#UISRNN-231"><span class="linenos">231</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
-</span><span id="UISRNN-232"><a href="#UISRNN-232"><span class="linenos">232</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-233"><a href="#UISRNN-233"><span class="linenos">233</span></a>
-</span><span id="UISRNN-234"><a href="#UISRNN-234"><span class="linenos">234</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
-</span><span id="UISRNN-235"><a href="#UISRNN-235"><span class="linenos">235</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
-</span><span id="UISRNN-236"><a href="#UISRNN-236"><span class="linenos">236</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="UISRNN-237"><a href="#UISRNN-237"><span class="linenos">237</span></a>
-</span><span id="UISRNN-238"><a href="#UISRNN-238"><span class="linenos">238</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
-</span><span id="UISRNN-239"><a href="#UISRNN-239"><span class="linenos">239</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN-240"><a href="#UISRNN-240"><span class="linenos">240</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
-</span><span id="UISRNN-241"><a href="#UISRNN-241"><span class="linenos">241</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
-</span><span id="UISRNN-242"><a href="#UISRNN-242"><span class="linenos">242</span></a>
-</span><span id="UISRNN-243"><a href="#UISRNN-243"><span class="linenos">243</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
-</span><span id="UISRNN-244"><a href="#UISRNN-244"><span class="linenos">244</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN-245"><a href="#UISRNN-245"><span class="linenos">245</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN-246"><a href="#UISRNN-246"><span class="linenos">246</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN-247"><a href="#UISRNN-247"><span class="linenos">247</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN-248"><a href="#UISRNN-248"><span class="linenos">248</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN-249"><a href="#UISRNN-249"><span class="linenos">249</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN-250"><a href="#UISRNN-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-251"><a href="#UISRNN-251"><span class="linenos">251</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN-252"><a href="#UISRNN-252"><span class="linenos">252</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
-</span><span id="UISRNN-253"><a href="#UISRNN-253"><span class="linenos">253</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
-</span><span id="UISRNN-254"><a href="#UISRNN-254"><span class="linenos">254</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
-</span><span id="UISRNN-255"><a href="#UISRNN-255"><span class="linenos">255</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN-256"><a href="#UISRNN-256"><span class="linenos">256</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN-257"><a href="#UISRNN-257"><span class="linenos">257</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN-258"><a href="#UISRNN-258"><span class="linenos">258</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN-259"><a href="#UISRNN-259"><span class="linenos">259</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN-260"><a href="#UISRNN-260"><span class="linenos">260</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN-261"><a href="#UISRNN-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-262"><a href="#UISRNN-262"><span class="linenos">262</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="UISRNN-263"><a href="#UISRNN-263"><span class="linenos">263</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="UISRNN-264"><a href="#UISRNN-264"><span class="linenos">264</span></a>      <span class="c1"># use mean to predict</span>
-</span><span id="UISRNN-265"><a href="#UISRNN-265"><span class="linenos">265</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="UISRNN-266"><a href="#UISRNN-266"><span class="linenos">266</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
-</span><span id="UISRNN-267"><a href="#UISRNN-267"><span class="linenos">267</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
-</span><span id="UISRNN-268"><a href="#UISRNN-268"><span class="linenos">268</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
-</span><span id="UISRNN-269"><a href="#UISRNN-269"><span class="linenos">269</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
-</span><span id="UISRNN-270"><a href="#UISRNN-270"><span class="linenos">270</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN-271"><a href="#UISRNN-271"><span class="linenos">271</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
-</span><span id="UISRNN-272"><a href="#UISRNN-272"><span class="linenos">272</span></a>
-</span><span id="UISRNN-273"><a href="#UISRNN-273"><span class="linenos">273</span></a>      <span class="c1"># Likelihood part.</span>
-</span><span id="UISRNN-274"><a href="#UISRNN-274"><span class="linenos">274</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN-275"><a href="#UISRNN-275"><span class="linenos">275</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
-</span><span id="UISRNN-276"><a href="#UISRNN-276"><span class="linenos">276</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
-</span><span id="UISRNN-277"><a href="#UISRNN-277"><span class="linenos">277</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
-</span><span id="UISRNN-278"><a href="#UISRNN-278"><span class="linenos">278</span></a>
-</span><span id="UISRNN-279"><a href="#UISRNN-279"><span class="linenos">279</span></a>      <span class="c1"># Sigma2 prior part.</span>
-</span><span id="UISRNN-280"><a href="#UISRNN-280"><span class="linenos">280</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
-</span><span id="UISRNN-281"><a href="#UISRNN-281"><span class="linenos">281</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="UISRNN-282"><a href="#UISRNN-282"><span class="linenos">282</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
-</span><span id="UISRNN-283"><a href="#UISRNN-283"><span class="linenos">283</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
-</span><span id="UISRNN-284"><a href="#UISRNN-284"><span class="linenos">284</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
-</span><span id="UISRNN-285"><a href="#UISRNN-285"><span class="linenos">285</span></a>
-</span><span id="UISRNN-286"><a href="#UISRNN-286"><span class="linenos">286</span></a>      <span class="c1"># Regularization part.</span>
-</span><span id="UISRNN-287"><a href="#UISRNN-287"><span class="linenos">287</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
-</span><span id="UISRNN-288"><a href="#UISRNN-288"><span class="linenos">288</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
-</span><span id="UISRNN-289"><a href="#UISRNN-289"><span class="linenos">289</span></a>
-</span><span id="UISRNN-290"><a href="#UISRNN-290"><span class="linenos">290</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
-</span><span id="UISRNN-291"><a href="#UISRNN-291"><span class="linenos">291</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
-</span><span id="UISRNN-292"><a href="#UISRNN-292"><span class="linenos">292</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
-</span><span id="UISRNN-293"><a href="#UISRNN-293"><span class="linenos">293</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
-</span><span id="UISRNN-294"><a href="#UISRNN-294"><span class="linenos">294</span></a>      <span class="c1"># avoid numerical issues</span>
-</span><span id="UISRNN-295"><a href="#UISRNN-295"><span class="linenos">295</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
-</span><span id="UISRNN-296"><a href="#UISRNN-296"><span class="linenos">296</span></a>
-</span><span id="UISRNN-297"><a href="#UISRNN-297"><span class="linenos">297</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
-</span><span id="UISRNN-298"><a href="#UISRNN-298"><span class="linenos">298</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="UISRNN-299"><a href="#UISRNN-299"><span class="linenos">299</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-300"><a href="#UISRNN-300"><span class="linenos">300</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN-301"><a href="#UISRNN-301"><span class="linenos">301</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-302"><a href="#UISRNN-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-303"><a href="#UISRNN-303"><span class="linenos">303</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-304"><a href="#UISRNN-304"><span class="linenos">304</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN-305"><a href="#UISRNN-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN-306"><a href="#UISRNN-306"><span class="linenos">306</span></a>                <span class="n">num_iter</span><span class="p">,</span>
-</span><span id="UISRNN-307"><a href="#UISRNN-307"><span class="linenos">307</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN-308"><a href="#UISRNN-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN-309"><a href="#UISRNN-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN-310"><a href="#UISRNN-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
-</span><span id="UISRNN-311"><a href="#UISRNN-311"><span class="linenos">311</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
-</span><span id="UISRNN-312"><a href="#UISRNN-312"><span class="linenos">312</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-313"><a href="#UISRNN-313"><span class="linenos">313</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
-</span><span id="UISRNN-314"><a href="#UISRNN-314"><span class="linenos">314</span></a>
-</span><span id="UISRNN-315"><a href="#UISRNN-315"><span class="linenos">315</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-316"><a href="#UISRNN-316"><span class="linenos">316</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
-</span><span id="UISRNN-317"><a href="#UISRNN-317"><span class="linenos">317</span></a>
-</span><span id="UISRNN-318"><a href="#UISRNN-318"><span class="linenos">318</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-319"><a href="#UISRNN-319"><span class="linenos">319</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
-</span><span id="UISRNN-320"><a href="#UISRNN-320"><span class="linenos">320</span></a><span class="sd">        concatenated training sequence:</span>
-</span><span id="UISRNN-321"><a href="#UISRNN-321"><span class="linenos">321</span></a>
-</span><span id="UISRNN-322"><a href="#UISRNN-322"><span class="linenos">322</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
-</span><span id="UISRNN-323"><a href="#UISRNN-323"><span class="linenos">323</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
-</span><span id="UISRNN-324"><a href="#UISRNN-324"><span class="linenos">324</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
-</span><span id="UISRNN-325"><a href="#UISRNN-325"><span class="linenos">325</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
-</span><span id="UISRNN-326"><a href="#UISRNN-326"><span class="linenos">326</span></a><span class="sd">           embeddings of one utterance.</span>
-</span><span id="UISRNN-327"><a href="#UISRNN-327"><span class="linenos">327</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
-</span><span id="UISRNN-328"><a href="#UISRNN-328"><span class="linenos">328</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
-</span><span id="UISRNN-329"><a href="#UISRNN-329"><span class="linenos">329</span></a><span class="sd">           for more details.</span>
-</span><span id="UISRNN-330"><a href="#UISRNN-330"><span class="linenos">330</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
-</span><span id="UISRNN-331"><a href="#UISRNN-331"><span class="linenos">331</span></a>
-</span><span id="UISRNN-332"><a href="#UISRNN-332"><span class="linenos">332</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
-</span><span id="UISRNN-333"><a href="#UISRNN-333"><span class="linenos">333</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
-</span><span id="UISRNN-334"><a href="#UISRNN-334"><span class="linenos">334</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
-</span><span id="UISRNN-335"><a href="#UISRNN-335"><span class="linenos">335</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
-</span><span id="UISRNN-336"><a href="#UISRNN-336"><span class="linenos">336</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-337"><a href="#UISRNN-337"><span class="linenos">337</span></a>
-</span><span id="UISRNN-338"><a href="#UISRNN-338"><span class="linenos">338</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-339"><a href="#UISRNN-339"><span class="linenos">339</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
-</span><span id="UISRNN-340"><a href="#UISRNN-340"><span class="linenos">340</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-341"><a href="#UISRNN-341"><span class="linenos">341</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN-342"><a href="#UISRNN-342"><span class="linenos">342</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
-</span><span id="UISRNN-343"><a href="#UISRNN-343"><span class="linenos">343</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN-344"><a href="#UISRNN-344"><span class="linenos">344</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
-</span><span id="UISRNN-345"><a href="#UISRNN-345"><span class="linenos">345</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN-346"><a href="#UISRNN-346"><span class="linenos">346</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN-347"><a href="#UISRNN-347"><span class="linenos">347</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
-</span><span id="UISRNN-348"><a href="#UISRNN-348"><span class="linenos">348</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
-</span><span id="UISRNN-349"><a href="#UISRNN-349"><span class="linenos">349</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
-</span><span id="UISRNN-350"><a href="#UISRNN-350"><span class="linenos">350</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
-</span><span id="UISRNN-351"><a href="#UISRNN-351"><span class="linenos">351</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-352"><a href="#UISRNN-352"><span class="linenos">352</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
-</span><span id="UISRNN-353"><a href="#UISRNN-353"><span class="linenos">353</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
-</span><span id="UISRNN-354"><a href="#UISRNN-354"><span class="linenos">354</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN-355"><a href="#UISRNN-355"><span class="linenos">355</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
-</span><span id="UISRNN-356"><a href="#UISRNN-356"><span class="linenos">356</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
-</span><span id="UISRNN-357"><a href="#UISRNN-357"><span class="linenos">357</span></a>      <span class="k">pass</span>
-</span><span id="UISRNN-358"><a href="#UISRNN-358"><span class="linenos">358</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN-359"><a href="#UISRNN-359"><span class="linenos">359</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-360"><a href="#UISRNN-360"><span class="linenos">360</span></a>
-</span><span id="UISRNN-361"><a href="#UISRNN-361"><span class="linenos">361</span></a>    <span class="c1"># estimate transition_bias</span>
-</span><span id="UISRNN-362"><a href="#UISRNN-362"><span class="linenos">362</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN-363"><a href="#UISRNN-363"><span class="linenos">363</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN-364"><a href="#UISRNN-364"><span class="linenos">364</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
-</span><span id="UISRNN-365"><a href="#UISRNN-365"><span class="linenos">365</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
-</span><span id="UISRNN-366"><a href="#UISRNN-366"><span class="linenos">366</span></a>      <span class="c1"># set or update transition_bias</span>
-</span><span id="UISRNN-367"><a href="#UISRNN-367"><span class="linenos">367</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN-368"><a href="#UISRNN-368"><span class="linenos">368</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
-</span><span id="UISRNN-369"><a href="#UISRNN-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN-370"><a href="#UISRNN-370"><span class="linenos">370</span></a>      <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN-371"><a href="#UISRNN-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="UISRNN-372"><a href="#UISRNN-372"><span class="linenos">372</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
-</span><span id="UISRNN-373"><a href="#UISRNN-373"><span class="linenos">373</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="UISRNN-374"><a href="#UISRNN-374"><span class="linenos">374</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
-</span><span id="UISRNN-375"><a href="#UISRNN-375"><span class="linenos">375</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN-376"><a href="#UISRNN-376"><span class="linenos">376</span></a>
-</span><span id="UISRNN-377"><a href="#UISRNN-377"><span class="linenos">377</span></a>    <span class="c1"># concatenate train_sequences</span>
-</span><span id="UISRNN-378"><a href="#UISRNN-378"><span class="linenos">378</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN-379"><a href="#UISRNN-379"><span class="linenos">379</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
-</span><span id="UISRNN-380"><a href="#UISRNN-380"><span class="linenos">380</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
-</span><span id="UISRNN-381"><a href="#UISRNN-381"><span class="linenos">381</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
-</span><span id="UISRNN-382"><a href="#UISRNN-382"><span class="linenos">382</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
-</span><span id="UISRNN-383"><a href="#UISRNN-383"><span class="linenos">383</span></a>         <span class="kc">True</span><span class="p">)</span>
-</span><span id="UISRNN-384"><a href="#UISRNN-384"><span class="linenos">384</span></a>
-</span><span id="UISRNN-385"><a href="#UISRNN-385"><span class="linenos">385</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
-</span><span id="UISRNN-386"><a href="#UISRNN-386"><span class="linenos">386</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN-387"><a href="#UISRNN-387"><span class="linenos">387</span></a>
-</span><span id="UISRNN-388"><a href="#UISRNN-388"><span class="linenos">388</span></a>  <span class="k">def</span> <span class="nf">_update_beam_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">):</span>
-</span><span id="UISRNN-389"><a href="#UISRNN-389"><span class="linenos">389</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update a beam state given a look ahead sequence and known cluster</span>
-</span><span id="UISRNN-390"><a href="#UISRNN-390"><span class="linenos">390</span></a><span class="sd">    assignments.</span>
-</span><span id="UISRNN-391"><a href="#UISRNN-391"><span class="linenos">391</span></a>
-</span><span id="UISRNN-392"><a href="#UISRNN-392"><span class="linenos">392</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-393"><a href="#UISRNN-393"><span class="linenos">393</span></a><span class="sd">      beam_state: A BeamState object.</span>
-</span><span id="UISRNN-394"><a href="#UISRNN-394"><span class="linenos">394</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
-</span><span id="UISRNN-395"><a href="#UISRNN-395"><span class="linenos">395</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
-</span><span id="UISRNN-396"><a href="#UISRNN-396"><span class="linenos">396</span></a><span class="sd">        D: observation dimension</span>
-</span><span id="UISRNN-397"><a href="#UISRNN-397"><span class="linenos">397</span></a><span class="sd">      cluster_seq: Cluster assignment sequence for look_ahead_seq.</span>
-</span><span id="UISRNN-398"><a href="#UISRNN-398"><span class="linenos">398</span></a>
-</span><span id="UISRNN-399"><a href="#UISRNN-399"><span class="linenos">399</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-400"><a href="#UISRNN-400"><span class="linenos">400</span></a><span class="sd">      new_beam_state: An updated BeamState object.</span>
-</span><span id="UISRNN-401"><a href="#UISRNN-401"><span class="linenos">401</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-402"><a href="#UISRNN-402"><span class="linenos">402</span></a>
-</span><span id="UISRNN-403"><a href="#UISRNN-403"><span class="linenos">403</span></a>    <span class="n">loss</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="UISRNN-404"><a href="#UISRNN-404"><span class="linenos">404</span></a>    <span class="n">new_beam_state</span> <span class="o">=</span> <span class="n">BeamState</span><span class="p">(</span><span class="n">beam_state</span><span class="p">)</span>
-</span><span id="UISRNN-405"><a href="#UISRNN-405"><span class="linenos">405</span></a>    <span class="k">for</span> <span class="n">sub_idx</span><span class="p">,</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster_seq</span><span class="p">):</span>
-</span><span id="UISRNN-406"><a href="#UISRNN-406"><span class="linenos">406</span></a>      <span class="k">if</span> <span class="n">cluster</span> <span class="o">&gt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># invalid trace</span>
-</span><span id="UISRNN-407"><a href="#UISRNN-407"><span class="linenos">407</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-408"><a href="#UISRNN-408"><span class="linenos">408</span></a>        <span class="k">break</span>
-</span><span id="UISRNN-409"><a href="#UISRNN-409"><span class="linenos">409</span></a>      <span class="k">elif</span> <span class="n">cluster</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># existing cluster</span>
-</span><span id="UISRNN-410"><a href="#UISRNN-410"><span class="linenos">410</span></a>        <span class="n">last_cluster</span> <span class="o">=</span> <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="UISRNN-411"><a href="#UISRNN-411"><span class="linenos">411</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN-412"><a href="#UISRNN-412"><span class="linenos">412</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]),</span>
-</span><span id="UISRNN-413"><a href="#UISRNN-413"><span class="linenos">413</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
-</span><span id="UISRNN-414"><a href="#UISRNN-414"><span class="linenos">414</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
-</span><span id="UISRNN-415"><a href="#UISRNN-415"><span class="linenos">415</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">==</span> <span class="n">last_cluster</span><span class="p">:</span>
-</span><span id="UISRNN-416"><a href="#UISRNN-416"><span class="linenos">416</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span>
-</span><span id="UISRNN-417"><a href="#UISRNN-417"><span class="linenos">417</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN-418"><a href="#UISRNN-418"><span class="linenos">418</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-419"><a href="#UISRNN-419"><span class="linenos">419</span></a>              <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-420"><a href="#UISRNN-420"><span class="linenos">420</span></a>                  <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
-</span><span id="UISRNN-421"><a href="#UISRNN-421"><span class="linenos">421</span></a>        <span class="c1"># update new mean and new hidden</span>
-</span><span id="UISRNN-422"><a href="#UISRNN-422"><span class="linenos">422</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
-</span><span id="UISRNN-423"><a href="#UISRNN-423"><span class="linenos">423</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
-</span><span id="UISRNN-424"><a href="#UISRNN-424"><span class="linenos">424</span></a>            <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span>
-</span><span id="UISRNN-425"><a href="#UISRNN-425"><span class="linenos">425</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span><span class="o">*</span><span class="p">(</span>
-</span><span id="UISRNN-426"><a href="#UISRNN-426"><span class="linenos">426</span></a>            <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span> <span class="o">-</span>
-</span><span id="UISRNN-427"><a href="#UISRNN-427"><span class="linenos">427</span></a>            <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span> <span class="o">+</span> <span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="UISRNN-428"><a href="#UISRNN-428"><span class="linenos">428</span></a>                <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span>
-</span><span id="UISRNN-429"><a href="#UISRNN-429"><span class="linenos">429</span></a>                    <span class="nb">float</span><span class="p">)</span>  <span class="c1"># use mean to predict</span>
-</span><span id="UISRNN-430"><a href="#UISRNN-430"><span class="linenos">430</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
-</span><span id="UISRNN-431"><a href="#UISRNN-431"><span class="linenos">431</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">!=</span> <span class="n">last_cluster</span><span class="p">:</span>
-</span><span id="UISRNN-432"><a href="#UISRNN-432"><span class="linenos">432</span></a>          <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="UISRNN-433"><a href="#UISRNN-433"><span class="linenos">433</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
-</span><span id="UISRNN-434"><a href="#UISRNN-434"><span class="linenos">434</span></a>      <span class="k">else</span><span class="p">:</span>  <span class="c1"># new cluster</span>
-</span><span id="UISRNN-435"><a href="#UISRNN-435"><span class="linenos">435</span></a>        <span class="n">init_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="UISRNN-436"><a href="#UISRNN-436"><span class="linenos">436</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="UISRNN-437"><a href="#UISRNN-437"><span class="linenos">437</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-438"><a href="#UISRNN-438"><span class="linenos">438</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">init_input</span><span class="p">,</span>
-</span><span id="UISRNN-439"><a href="#UISRNN-439"><span class="linenos">439</span></a>                                      <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="p">)</span>
-</span><span id="UISRNN-440"><a href="#UISRNN-440"><span class="linenos">440</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN-441"><a href="#UISRNN-441"><span class="linenos">441</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">mean</span><span class="p">),</span>
-</span><span id="UISRNN-442"><a href="#UISRNN-442"><span class="linenos">442</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
-</span><span id="UISRNN-443"><a href="#UISRNN-443"><span class="linenos">443</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
-</span><span id="UISRNN-444"><a href="#UISRNN-444"><span class="linenos">444</span></a>        <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-445"><a href="#UISRNN-445"><span class="linenos">445</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
-</span><span id="UISRNN-446"><a href="#UISRNN-446"><span class="linenos">446</span></a>                <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
-</span><span id="UISRNN-447"><a href="#UISRNN-447"><span class="linenos">447</span></a>        <span class="c1"># update new min and new hidden</span>
-</span><span id="UISRNN-448"><a href="#UISRNN-448"><span class="linenos">448</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
-</span><span id="UISRNN-449"><a href="#UISRNN-449"><span class="linenos">449</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
-</span><span id="UISRNN-450"><a href="#UISRNN-450"><span class="linenos">450</span></a>            <span class="n">hidden</span><span class="p">)</span>
-</span><span id="UISRNN-451"><a href="#UISRNN-451"><span class="linenos">451</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">)</span>
-</span><span id="UISRNN-452"><a href="#UISRNN-452"><span class="linenos">452</span></a>      <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">+=</span> <span class="n">loss</span>
-</span><span id="UISRNN-453"><a href="#UISRNN-453"><span class="linenos">453</span></a>    <span class="k">return</span> <span class="n">new_beam_state</span>
-</span><span id="UISRNN-454"><a href="#UISRNN-454"><span class="linenos">454</span></a>
-</span><span id="UISRNN-455"><a href="#UISRNN-455"><span class="linenos">455</span></a>  <span class="k">def</span> <span class="nf">_calculate_score</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">):</span>
-</span><span id="UISRNN-456"><a href="#UISRNN-456"><span class="linenos">456</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Calculate negative log likelihoods for all possible state allocations</span>
-</span><span id="UISRNN-457"><a href="#UISRNN-457"><span class="linenos">457</span></a><span class="sd">       of a look ahead sequence, according to the current beam state.</span>
-</span><span id="UISRNN-458"><a href="#UISRNN-458"><span class="linenos">458</span></a>
-</span><span id="UISRNN-459"><a href="#UISRNN-459"><span class="linenos">459</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-460"><a href="#UISRNN-460"><span class="linenos">460</span></a><span class="sd">      beam_state: A BeamState object.</span>
-</span><span id="UISRNN-461"><a href="#UISRNN-461"><span class="linenos">461</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
-</span><span id="UISRNN-462"><a href="#UISRNN-462"><span class="linenos">462</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
-</span><span id="UISRNN-463"><a href="#UISRNN-463"><span class="linenos">463</span></a><span class="sd">        D: observation dimension</span>
-</span><span id="UISRNN-464"><a href="#UISRNN-464"><span class="linenos">464</span></a>
-</span><span id="UISRNN-465"><a href="#UISRNN-465"><span class="linenos">465</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-466"><a href="#UISRNN-466"><span class="linenos">466</span></a><span class="sd">      beam_score_set: a set of scores for each possible state allocation.</span>
-</span><span id="UISRNN-467"><a href="#UISRNN-467"><span class="linenos">467</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-468"><a href="#UISRNN-468"><span class="linenos">468</span></a>
-</span><span id="UISRNN-469"><a href="#UISRNN-469"><span class="linenos">469</span></a>    <span class="n">look_ahead</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN-470"><a href="#UISRNN-470"><span class="linenos">470</span></a>    <span class="n">beam_num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span>
-</span><span id="UISRNN-471"><a href="#UISRNN-471"><span class="linenos">471</span></a>    <span class="n">beam_score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="UISRNN-472"><a href="#UISRNN-472"><span class="linenos">472</span></a>        <span class="n">beam_num_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">look_ahead</span><span class="p">))</span>
-</span><span id="UISRNN-473"><a href="#UISRNN-473"><span class="linenos">473</span></a>    <span class="k">for</span> <span class="n">cluster_seq</span><span class="p">,</span> <span class="n">_</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">ndenumerate</span><span class="p">(</span><span class="n">beam_score_set</span><span class="p">):</span>
-</span><span id="UISRNN-474"><a href="#UISRNN-474"><span class="linenos">474</span></a>      <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span>
-</span><span id="UISRNN-475"><a href="#UISRNN-475"><span class="linenos">475</span></a>                                                   <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="UISRNN-476"><a href="#UISRNN-476"><span class="linenos">476</span></a>      <span class="n">beam_score_set</span><span class="p">[</span><span class="n">cluster_seq</span><span class="p">]</span> <span class="o">=</span> <span class="n">updated_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span>
-</span><span id="UISRNN-477"><a href="#UISRNN-477"><span class="linenos">477</span></a>    <span class="k">return</span> <span class="n">beam_score_set</span>
-</span><span id="UISRNN-478"><a href="#UISRNN-478"><span class="linenos">478</span></a>
-</span><span id="UISRNN-479"><a href="#UISRNN-479"><span class="linenos">479</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-480"><a href="#UISRNN-480"><span class="linenos">480</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
-</span><span id="UISRNN-481"><a href="#UISRNN-481"><span class="linenos">481</span></a>
-</span><span id="UISRNN-482"><a href="#UISRNN-482"><span class="linenos">482</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-483"><a href="#UISRNN-483"><span class="linenos">483</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
-</span><span id="UISRNN-484"><a href="#UISRNN-484"><span class="linenos">484</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN-485"><a href="#UISRNN-485"><span class="linenos">485</span></a>
-</span><span id="UISRNN-486"><a href="#UISRNN-486"><span class="linenos">486</span></a><span class="sd">        - `N`: length of one test utterance.</span>
-</span><span id="UISRNN-487"><a href="#UISRNN-487"><span class="linenos">487</span></a><span class="sd">        - `D` : observation dimension.</span>
-</span><span id="UISRNN-488"><a href="#UISRNN-488"><span class="linenos">488</span></a>
-</span><span id="UISRNN-489"><a href="#UISRNN-489"><span class="linenos">489</span></a><span class="sd">        For example:</span>
-</span><span id="UISRNN-490"><a href="#UISRNN-490"><span class="linenos">490</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-491"><a href="#UISRNN-491"><span class="linenos">491</span></a><span class="sd">      test_sequence =</span>
-</span><span id="UISRNN-492"><a href="#UISRNN-492"><span class="linenos">492</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-493"><a href="#UISRNN-493"><span class="linenos">493</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-494"><a href="#UISRNN-494"><span class="linenos">494</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-495"><a href="#UISRNN-495"><span class="linenos">495</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-496"><a href="#UISRNN-496"><span class="linenos">496</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN-497"><a href="#UISRNN-497"><span class="linenos">497</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN-498"><a href="#UISRNN-498"><span class="linenos">498</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN-499"><a href="#UISRNN-499"><span class="linenos">499</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-500"><a href="#UISRNN-500"><span class="linenos">500</span></a>
-</span><span id="UISRNN-501"><a href="#UISRNN-501"><span class="linenos">501</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-502"><a href="#UISRNN-502"><span class="linenos">502</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
-</span><span id="UISRNN-503"><a href="#UISRNN-503"><span class="linenos">503</span></a><span class="sd">        an array of integers, of size `N`.</span>
-</span><span id="UISRNN-504"><a href="#UISRNN-504"><span class="linenos">504</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
-</span><span id="UISRNN-505"><a href="#UISRNN-505"><span class="linenos">505</span></a>
-</span><span id="UISRNN-506"><a href="#UISRNN-506"><span class="linenos">506</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-507"><a href="#UISRNN-507"><span class="linenos">507</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
-</span><span id="UISRNN-508"><a href="#UISRNN-508"><span class="linenos">508</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
-</span><span id="UISRNN-509"><a href="#UISRNN-509"><span class="linenos">509</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-510"><a href="#UISRNN-510"><span class="linenos">510</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN-511"><a href="#UISRNN-511"><span class="linenos">511</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN-512"><a href="#UISRNN-512"><span class="linenos">512</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN-513"><a href="#UISRNN-513"><span class="linenos">513</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-514"><a href="#UISRNN-514"><span class="linenos">514</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN-515"><a href="#UISRNN-515"><span class="linenos">515</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN-516"><a href="#UISRNN-516"><span class="linenos">516</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-517"><a href="#UISRNN-517"><span class="linenos">517</span></a>    <span class="c1"># check size</span>
-</span><span id="UISRNN-518"><a href="#UISRNN-518"><span class="linenos">518</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN-519"><a href="#UISRNN-519"><span class="linenos">519</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN-520"><a href="#UISRNN-520"><span class="linenos">520</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN-521"><a href="#UISRNN-521"><span class="linenos">521</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN-522"><a href="#UISRNN-522"><span class="linenos">522</span></a>
-</span><span id="UISRNN-523"><a href="#UISRNN-523"><span class="linenos">523</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-</span><span id="UISRNN-524"><a href="#UISRNN-524"><span class="linenos">524</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN-525"><a href="#UISRNN-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="UISRNN-526"><a href="#UISRNN-526"><span class="linenos">526</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN-527"><a href="#UISRNN-527"><span class="linenos">527</span></a>    <span class="c1"># bookkeeping for beam search</span>
-</span><span id="UISRNN-528"><a href="#UISRNN-528"><span class="linenos">528</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
-</span><span id="UISRNN-529"><a href="#UISRNN-529"><span class="linenos">529</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
-</span><span id="UISRNN-530"><a href="#UISRNN-530"><span class="linenos">530</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
-</span><span id="UISRNN-531"><a href="#UISRNN-531"><span class="linenos">531</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
-</span><span id="UISRNN-532"><a href="#UISRNN-532"><span class="linenos">532</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
-</span><span id="UISRNN-533"><a href="#UISRNN-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="UISRNN-534"><a href="#UISRNN-534"><span class="linenos">534</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="UISRNN-535"><a href="#UISRNN-535"><span class="linenos">535</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="UISRNN-536"><a href="#UISRNN-536"><span class="linenos">536</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-</span><span id="UISRNN-537"><a href="#UISRNN-537"><span class="linenos">537</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
-</span><span id="UISRNN-538"><a href="#UISRNN-538"><span class="linenos">538</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
-</span><span id="UISRNN-539"><a href="#UISRNN-539"><span class="linenos">539</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
-</span><span id="UISRNN-540"><a href="#UISRNN-540"><span class="linenos">540</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-</span><span id="UISRNN-541"><a href="#UISRNN-541"><span class="linenos">541</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
-</span><span id="UISRNN-542"><a href="#UISRNN-542"><span class="linenos">542</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
-</span><span id="UISRNN-543"><a href="#UISRNN-543"><span class="linenos">543</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
-</span><span id="UISRNN-544"><a href="#UISRNN-544"><span class="linenos">544</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
-</span><span id="UISRNN-545"><a href="#UISRNN-545"><span class="linenos">545</span></a>      <span class="c1"># find top scores</span>
-</span><span id="UISRNN-546"><a href="#UISRNN-546"><span class="linenos">546</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-547"><a href="#UISRNN-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="UISRNN-548"><a href="#UISRNN-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
-</span><span id="UISRNN-549"><a href="#UISRNN-549"><span class="linenos">549</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN-550"><a href="#UISRNN-550"><span class="linenos">550</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN-551"><a href="#UISRNN-551"><span class="linenos">551</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
-</span><span id="UISRNN-552"><a href="#UISRNN-552"><span class="linenos">552</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
-</span><span id="UISRNN-553"><a href="#UISRNN-553"><span class="linenos">553</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
-</span><span id="UISRNN-554"><a href="#UISRNN-554"><span class="linenos">554</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
-</span><span id="UISRNN-555"><a href="#UISRNN-555"><span class="linenos">555</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
-</span><span id="UISRNN-556"><a href="#UISRNN-556"><span class="linenos">556</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="UISRNN-557"><a href="#UISRNN-557"><span class="linenos">557</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
-</span><span id="UISRNN-558"><a href="#UISRNN-558"><span class="linenos">558</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="UISRNN-559"><a href="#UISRNN-559"><span class="linenos">559</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
-</span><span id="UISRNN-560"><a href="#UISRNN-560"><span class="linenos">560</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
-</span><span id="UISRNN-561"><a href="#UISRNN-561"><span class="linenos">561</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
-</span><span id="UISRNN-562"><a href="#UISRNN-562"><span class="linenos">562</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
-</span><span id="UISRNN-563"><a href="#UISRNN-563"><span class="linenos">563</span></a>
-</span><span id="UISRNN-564"><a href="#UISRNN-564"><span class="linenos">564</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN-565"><a href="#UISRNN-565"><span class="linenos">565</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
-</span><span id="UISRNN-566"><a href="#UISRNN-566"><span class="linenos">566</span></a>
-</span><span id="UISRNN-567"><a href="#UISRNN-567"><span class="linenos">567</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN-568"><a href="#UISRNN-568"><span class="linenos">568</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
-</span><span id="UISRNN-569"><a href="#UISRNN-569"><span class="linenos">569</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="UISRNN-570"><a href="#UISRNN-570"><span class="linenos">570</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
-</span><span id="UISRNN-571"><a href="#UISRNN-571"><span class="linenos">571</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN-572"><a href="#UISRNN-572"><span class="linenos">572</span></a>
-</span><span id="UISRNN-573"><a href="#UISRNN-573"><span class="linenos">573</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN-574"><a href="#UISRNN-574"><span class="linenos">574</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
-</span><span id="UISRNN-575"><a href="#UISRNN-575"><span class="linenos">575</span></a>
-</span><span id="UISRNN-576"><a href="#UISRNN-576"><span class="linenos">576</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
-</span><span id="UISRNN-577"><a href="#UISRNN-577"><span class="linenos">577</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
-</span><span id="UISRNN-578"><a href="#UISRNN-578"><span class="linenos">578</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
-</span><span id="UISRNN-579"><a href="#UISRNN-579"><span class="linenos">579</span></a><span class="sd">           be a 1-dim list of strings</span>
-</span><span id="UISRNN-580"><a href="#UISRNN-580"><span class="linenos">580</span></a>
-</span><span id="UISRNN-581"><a href="#UISRNN-581"><span class="linenos">581</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN-582"><a href="#UISRNN-582"><span class="linenos">582</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="UISRNN-583"><a href="#UISRNN-583"><span class="linenos">583</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN-584"><a href="#UISRNN-584"><span class="linenos">584</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN-585"><a href="#UISRNN-585"><span class="linenos">585</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN-586"><a href="#UISRNN-586"><span class="linenos">586</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN-587"><a href="#UISRNN-587"><span class="linenos">587</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN-588"><a href="#UISRNN-588"><span class="linenos">588</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN-589"><a href="#UISRNN-589"><span class="linenos">589</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
-</span><span id="UISRNN-590"><a href="#UISRNN-590"><span class="linenos">590</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN-81"><a href="#UISRNN-81"><span class="linenos"> 81</span></a><span class="k">class</span> <span class="nc">UISRNN</span><span class="p">:</span>
+</span><span id="UISRNN-82"><a href="#UISRNN-82"><span class="linenos"> 82</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Unbounded Interleaved-State Recurrent Neural Networks.&quot;&quot;&quot;</span>
+</span><span id="UISRNN-83"><a href="#UISRNN-83"><span class="linenos"> 83</span></a>
+</span><span id="UISRNN-84"><a href="#UISRNN-84"><span class="linenos"> 84</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-85"><a href="#UISRNN-85"><span class="linenos"> 85</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
+</span><span id="UISRNN-86"><a href="#UISRNN-86"><span class="linenos"> 86</span></a>
+</span><span id="UISRNN-87"><a href="#UISRNN-87"><span class="linenos"> 87</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-88"><a href="#UISRNN-88"><span class="linenos"> 88</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-89"><a href="#UISRNN-89"><span class="linenos"> 89</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-90"><a href="#UISRNN-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
+</span><span id="UISRNN-91"><a href="#UISRNN-91"><span class="linenos"> 91</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
+</span><span id="UISRNN-92"><a href="#UISRNN-92"><span class="linenos"> 92</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-93"><a href="#UISRNN-93"><span class="linenos"> 93</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="UISRNN-94"><a href="#UISRNN-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN-95"><a href="#UISRNN-95"><span class="linenos"> 95</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-96"><a href="#UISRNN-96"><span class="linenos"> 96</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-97"><a href="#UISRNN-97"><span class="linenos"> 97</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-98"><a href="#UISRNN-98"><span class="linenos"> 98</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
+</span><span id="UISRNN-99"><a href="#UISRNN-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-100"><a href="#UISRNN-100"><span class="linenos">100</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-101"><a href="#UISRNN-101"><span class="linenos">101</span></a>    <span class="c1"># initial values of variables</span>
+</span><span id="UISRNN-102"><a href="#UISRNN-102"><span class="linenos">102</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="UISRNN-103"><a href="#UISRNN-103"><span class="linenos">103</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-104"><a href="#UISRNN-104"><span class="linenos">104</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-105"><a href="#UISRNN-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
+</span><span id="UISRNN-106"><a href="#UISRNN-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="UISRNN-107"><a href="#UISRNN-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
+</span><span id="UISRNN-108"><a href="#UISRNN-108"><span class="linenos">108</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">colortimelog</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
+</span><span id="UISRNN-109"><a href="#UISRNN-109"><span class="linenos">109</span></a>
+</span><span id="UISRNN-110"><a href="#UISRNN-110"><span class="linenos">110</span></a>  <span class="k">def</span> <span class="nf">_get_optimizer</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">optimizer</span><span class="p">,</span> <span class="n">learning_rate</span><span class="p">):</span>
+</span><span id="UISRNN-111"><a href="#UISRNN-111"><span class="linenos">111</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Get optimizer for UISRNN.</span>
+</span><span id="UISRNN-112"><a href="#UISRNN-112"><span class="linenos">112</span></a>
+</span><span id="UISRNN-113"><a href="#UISRNN-113"><span class="linenos">113</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-114"><a href="#UISRNN-114"><span class="linenos">114</span></a><span class="sd">      optimizer: string - name of the optimizer.</span>
+</span><span id="UISRNN-115"><a href="#UISRNN-115"><span class="linenos">115</span></a><span class="sd">      learning_rate: - learning rate for the entire model.</span>
+</span><span id="UISRNN-116"><a href="#UISRNN-116"><span class="linenos">116</span></a><span class="sd">        We do not customize learning rate for separate parts.</span>
+</span><span id="UISRNN-117"><a href="#UISRNN-117"><span class="linenos">117</span></a>
+</span><span id="UISRNN-118"><a href="#UISRNN-118"><span class="linenos">118</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-119"><a href="#UISRNN-119"><span class="linenos">119</span></a><span class="sd">      a pytorch &quot;optim&quot; object</span>
+</span><span id="UISRNN-120"><a href="#UISRNN-120"><span class="linenos">120</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-121"><a href="#UISRNN-121"><span class="linenos">121</span></a>    <span class="n">params</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="UISRNN-122"><a href="#UISRNN-122"><span class="linenos">122</span></a>        <span class="p">{</span>
+</span><span id="UISRNN-123"><a href="#UISRNN-123"><span class="linenos">123</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
+</span><span id="UISRNN-124"><a href="#UISRNN-124"><span class="linenos">124</span></a>        <span class="p">},</span>  <span class="c1"># rnn parameters</span>
+</span><span id="UISRNN-125"><a href="#UISRNN-125"><span class="linenos">125</span></a>        <span class="p">{</span>
+</span><span id="UISRNN-126"><a href="#UISRNN-126"><span class="linenos">126</span></a>            <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span>
+</span><span id="UISRNN-127"><a href="#UISRNN-127"><span class="linenos">127</span></a>        <span class="p">}</span>  <span class="c1"># rnn initial hidden state</span>
+</span><span id="UISRNN-128"><a href="#UISRNN-128"><span class="linenos">128</span></a>    <span class="p">]</span>
+</span><span id="UISRNN-129"><a href="#UISRNN-129"><span class="linenos">129</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span><span class="p">:</span>  <span class="c1"># train sigma2</span>
+</span><span id="UISRNN-130"><a href="#UISRNN-130"><span class="linenos">130</span></a>      <span class="n">params</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="UISRNN-131"><a href="#UISRNN-131"><span class="linenos">131</span></a>          <span class="s1">&#39;params&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="UISRNN-132"><a href="#UISRNN-132"><span class="linenos">132</span></a>      <span class="p">})</span>  <span class="c1"># variance parameters</span>
+</span><span id="UISRNN-133"><a href="#UISRNN-133"><span class="linenos">133</span></a>    <span class="k">assert</span> <span class="n">optimizer</span> <span class="o">==</span> <span class="s1">&#39;adam&#39;</span><span class="p">,</span> <span class="s1">&#39;Only adam optimizer is supported.&#39;</span>
+</span><span id="UISRNN-134"><a href="#UISRNN-134"><span class="linenos">134</span></a>    <span class="k">return</span> <span class="n">optim</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span><span class="n">params</span><span class="p">,</span> <span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="UISRNN-135"><a href="#UISRNN-135"><span class="linenos">135</span></a>
+</span><span id="UISRNN-136"><a href="#UISRNN-136"><span class="linenos">136</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN-137"><a href="#UISRNN-137"><span class="linenos">137</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
+</span><span id="UISRNN-138"><a href="#UISRNN-138"><span class="linenos">138</span></a>
+</span><span id="UISRNN-139"><a href="#UISRNN-139"><span class="linenos">139</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-140"><a href="#UISRNN-140"><span class="linenos">140</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN-141"><a href="#UISRNN-141"><span class="linenos">141</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-142"><a href="#UISRNN-142"><span class="linenos">142</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
+</span><span id="UISRNN-143"><a href="#UISRNN-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
+</span><span id="UISRNN-144"><a href="#UISRNN-144"><span class="linenos">144</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
+</span><span id="UISRNN-145"><a href="#UISRNN-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN-146"><a href="#UISRNN-146"><span class="linenos">146</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
+</span><span id="UISRNN-147"><a href="#UISRNN-147"><span class="linenos">147</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="UISRNN-148"><a href="#UISRNN-148"><span class="linenos">148</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
+</span><span id="UISRNN-149"><a href="#UISRNN-149"><span class="linenos">149</span></a>
+</span><span id="UISRNN-150"><a href="#UISRNN-150"><span class="linenos">150</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN-151"><a href="#UISRNN-151"><span class="linenos">151</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
+</span><span id="UISRNN-152"><a href="#UISRNN-152"><span class="linenos">152</span></a>
+</span><span id="UISRNN-153"><a href="#UISRNN-153"><span class="linenos">153</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-154"><a href="#UISRNN-154"><span class="linenos">154</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN-155"><a href="#UISRNN-155"><span class="linenos">155</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-156"><a href="#UISRNN-156"><span class="linenos">156</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
+</span><span id="UISRNN-157"><a href="#UISRNN-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-158"><a href="#UISRNN-158"><span class="linenos">158</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-159"><a href="#UISRNN-159"><span class="linenos">159</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-160"><a href="#UISRNN-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-161"><a href="#UISRNN-161"><span class="linenos">161</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
+</span><span id="UISRNN-162"><a href="#UISRNN-162"><span class="linenos">162</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-163"><a href="#UISRNN-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
+</span><span id="UISRNN-164"><a href="#UISRNN-164"><span class="linenos">164</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN-165"><a href="#UISRNN-165"><span class="linenos">165</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN-166"><a href="#UISRNN-166"><span class="linenos">166</span></a>
+</span><span id="UISRNN-167"><a href="#UISRNN-167"><span class="linenos">167</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-168"><a href="#UISRNN-168"><span class="linenos">168</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
+</span><span id="UISRNN-169"><a href="#UISRNN-169"><span class="linenos">169</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN-170"><a href="#UISRNN-170"><span class="linenos">170</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
+</span><span id="UISRNN-171"><a href="#UISRNN-171"><span class="linenos">171</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
+</span><span id="UISRNN-172"><a href="#UISRNN-172"><span class="linenos">172</span></a>
+</span><span id="UISRNN-173"><a href="#UISRNN-173"><span class="linenos">173</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-174"><a href="#UISRNN-174"><span class="linenos">174</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
+</span><span id="UISRNN-175"><a href="#UISRNN-175"><span class="linenos">175</span></a>
+</span><span id="UISRNN-176"><a href="#UISRNN-176"><span class="linenos">176</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-177"><a href="#UISRNN-177"><span class="linenos">177</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
+</span><span id="UISRNN-178"><a href="#UISRNN-178"><span class="linenos">178</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN-179"><a href="#UISRNN-179"><span class="linenos">179</span></a>
+</span><span id="UISRNN-180"><a href="#UISRNN-180"><span class="linenos">180</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
+</span><span id="UISRNN-181"><a href="#UISRNN-181"><span class="linenos">181</span></a><span class="sd">        - `D`: observation dimension.</span>
+</span><span id="UISRNN-182"><a href="#UISRNN-182"><span class="linenos">182</span></a>
+</span><span id="UISRNN-183"><a href="#UISRNN-183"><span class="linenos">183</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN-184"><a href="#UISRNN-184"><span class="linenos">184</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-185"><a href="#UISRNN-185"><span class="linenos">185</span></a><span class="sd">      train_sequence =</span>
+</span><span id="UISRNN-186"><a href="#UISRNN-186"><span class="linenos">186</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN-187"><a href="#UISRNN-187"><span class="linenos">187</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN-188"><a href="#UISRNN-188"><span class="linenos">188</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN-189"><a href="#UISRNN-189"><span class="linenos">189</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN-190"><a href="#UISRNN-190"><span class="linenos">190</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN-191"><a href="#UISRNN-191"><span class="linenos">191</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-192"><a href="#UISRNN-192"><span class="linenos">192</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN-193"><a href="#UISRNN-193"><span class="linenos">193</span></a>
+</span><span id="UISRNN-194"><a href="#UISRNN-194"><span class="linenos">194</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
+</span><span id="UISRNN-195"><a href="#UISRNN-195"><span class="linenos">195</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
+</span><span id="UISRNN-196"><a href="#UISRNN-196"><span class="linenos">196</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
+</span><span id="UISRNN-197"><a href="#UISRNN-197"><span class="linenos">197</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN-198"><a href="#UISRNN-198"><span class="linenos">198</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-199"><a href="#UISRNN-199"><span class="linenos">199</span></a><span class="sd">      train_cluster_id =</span>
+</span><span id="UISRNN-200"><a href="#UISRNN-200"><span class="linenos">200</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
+</span><span id="UISRNN-201"><a href="#UISRNN-201"><span class="linenos">201</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-202"><a href="#UISRNN-202"><span class="linenos">202</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
+</span><span id="UISRNN-203"><a href="#UISRNN-203"><span class="linenos">203</span></a>
+</span><span id="UISRNN-204"><a href="#UISRNN-204"><span class="linenos">204</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
+</span><span id="UISRNN-205"><a href="#UISRNN-205"><span class="linenos">205</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
+</span><span id="UISRNN-206"><a href="#UISRNN-206"><span class="linenos">206</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-207"><a href="#UISRNN-207"><span class="linenos">207</span></a>
+</span><span id="UISRNN-208"><a href="#UISRNN-208"><span class="linenos">208</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-209"><a href="#UISRNN-209"><span class="linenos">209</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
+</span><span id="UISRNN-210"><a href="#UISRNN-210"><span class="linenos">210</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
+</span><span id="UISRNN-211"><a href="#UISRNN-211"><span class="linenos">211</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-212"><a href="#UISRNN-212"><span class="linenos">212</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN-213"><a href="#UISRNN-213"><span class="linenos">213</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN-214"><a href="#UISRNN-214"><span class="linenos">214</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN-215"><a href="#UISRNN-215"><span class="linenos">215</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-216"><a href="#UISRNN-216"><span class="linenos">216</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN-217"><a href="#UISRNN-217"><span class="linenos">217</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
+</span><span id="UISRNN-218"><a href="#UISRNN-218"><span class="linenos">218</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN-219"><a href="#UISRNN-219"><span class="linenos">219</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
+</span><span id="UISRNN-220"><a href="#UISRNN-220"><span class="linenos">220</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-221"><a href="#UISRNN-221"><span class="linenos">221</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN-222"><a href="#UISRNN-222"><span class="linenos">222</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN-223"><a href="#UISRNN-223"><span class="linenos">223</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-224"><a href="#UISRNN-224"><span class="linenos">224</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="UISRNN-225"><a href="#UISRNN-225"><span class="linenos">225</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-226"><a href="#UISRNN-226"><span class="linenos">226</span></a>    <span class="c1"># check length and size</span>
+</span><span id="UISRNN-227"><a href="#UISRNN-227"><span class="linenos">227</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN-228"><a href="#UISRNN-228"><span class="linenos">228</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN-229"><a href="#UISRNN-229"><span class="linenos">229</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN-230"><a href="#UISRNN-230"><span class="linenos">230</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-231"><a href="#UISRNN-231"><span class="linenos">231</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
+</span><span id="UISRNN-232"><a href="#UISRNN-232"><span class="linenos">232</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
+</span><span id="UISRNN-233"><a href="#UISRNN-233"><span class="linenos">233</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-234"><a href="#UISRNN-234"><span class="linenos">234</span></a>
+</span><span id="UISRNN-235"><a href="#UISRNN-235"><span class="linenos">235</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
+</span><span id="UISRNN-236"><a href="#UISRNN-236"><span class="linenos">236</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
+</span><span id="UISRNN-237"><a href="#UISRNN-237"><span class="linenos">237</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="UISRNN-238"><a href="#UISRNN-238"><span class="linenos">238</span></a>
+</span><span id="UISRNN-239"><a href="#UISRNN-239"><span class="linenos">239</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
+</span><span id="UISRNN-240"><a href="#UISRNN-240"><span class="linenos">240</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN-241"><a href="#UISRNN-241"><span class="linenos">241</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
+</span><span id="UISRNN-242"><a href="#UISRNN-242"><span class="linenos">242</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
+</span><span id="UISRNN-243"><a href="#UISRNN-243"><span class="linenos">243</span></a>
+</span><span id="UISRNN-244"><a href="#UISRNN-244"><span class="linenos">244</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
+</span><span id="UISRNN-245"><a href="#UISRNN-245"><span class="linenos">245</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN-246"><a href="#UISRNN-246"><span class="linenos">246</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN-247"><a href="#UISRNN-247"><span class="linenos">247</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN-248"><a href="#UISRNN-248"><span class="linenos">248</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN-249"><a href="#UISRNN-249"><span class="linenos">249</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN-250"><a href="#UISRNN-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN-251"><a href="#UISRNN-251"><span class="linenos">251</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-252"><a href="#UISRNN-252"><span class="linenos">252</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN-253"><a href="#UISRNN-253"><span class="linenos">253</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
+</span><span id="UISRNN-254"><a href="#UISRNN-254"><span class="linenos">254</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
+</span><span id="UISRNN-255"><a href="#UISRNN-255"><span class="linenos">255</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
+</span><span id="UISRNN-256"><a href="#UISRNN-256"><span class="linenos">256</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN-257"><a href="#UISRNN-257"><span class="linenos">257</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN-258"><a href="#UISRNN-258"><span class="linenos">258</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN-259"><a href="#UISRNN-259"><span class="linenos">259</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN-260"><a href="#UISRNN-260"><span class="linenos">260</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN-261"><a href="#UISRNN-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN-262"><a href="#UISRNN-262"><span class="linenos">262</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-263"><a href="#UISRNN-263"><span class="linenos">263</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="UISRNN-264"><a href="#UISRNN-264"><span class="linenos">264</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="UISRNN-265"><a href="#UISRNN-265"><span class="linenos">265</span></a>      <span class="c1"># use mean to predict</span>
+</span><span id="UISRNN-266"><a href="#UISRNN-266"><span class="linenos">266</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="UISRNN-267"><a href="#UISRNN-267"><span class="linenos">267</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
+</span><span id="UISRNN-268"><a href="#UISRNN-268"><span class="linenos">268</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
+</span><span id="UISRNN-269"><a href="#UISRNN-269"><span class="linenos">269</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
+</span><span id="UISRNN-270"><a href="#UISRNN-270"><span class="linenos">270</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
+</span><span id="UISRNN-271"><a href="#UISRNN-271"><span class="linenos">271</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN-272"><a href="#UISRNN-272"><span class="linenos">272</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
+</span><span id="UISRNN-273"><a href="#UISRNN-273"><span class="linenos">273</span></a>
+</span><span id="UISRNN-274"><a href="#UISRNN-274"><span class="linenos">274</span></a>      <span class="c1"># Likelihood part.</span>
+</span><span id="UISRNN-275"><a href="#UISRNN-275"><span class="linenos">275</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN-276"><a href="#UISRNN-276"><span class="linenos">276</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
+</span><span id="UISRNN-277"><a href="#UISRNN-277"><span class="linenos">277</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
+</span><span id="UISRNN-278"><a href="#UISRNN-278"><span class="linenos">278</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
+</span><span id="UISRNN-279"><a href="#UISRNN-279"><span class="linenos">279</span></a>
+</span><span id="UISRNN-280"><a href="#UISRNN-280"><span class="linenos">280</span></a>      <span class="c1"># Sigma2 prior part.</span>
+</span><span id="UISRNN-281"><a href="#UISRNN-281"><span class="linenos">281</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
+</span><span id="UISRNN-282"><a href="#UISRNN-282"><span class="linenos">282</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="UISRNN-283"><a href="#UISRNN-283"><span class="linenos">283</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
+</span><span id="UISRNN-284"><a href="#UISRNN-284"><span class="linenos">284</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
+</span><span id="UISRNN-285"><a href="#UISRNN-285"><span class="linenos">285</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
+</span><span id="UISRNN-286"><a href="#UISRNN-286"><span class="linenos">286</span></a>
+</span><span id="UISRNN-287"><a href="#UISRNN-287"><span class="linenos">287</span></a>      <span class="c1"># Regularization part.</span>
+</span><span id="UISRNN-288"><a href="#UISRNN-288"><span class="linenos">288</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
+</span><span id="UISRNN-289"><a href="#UISRNN-289"><span class="linenos">289</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
+</span><span id="UISRNN-290"><a href="#UISRNN-290"><span class="linenos">290</span></a>
+</span><span id="UISRNN-291"><a href="#UISRNN-291"><span class="linenos">291</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
+</span><span id="UISRNN-292"><a href="#UISRNN-292"><span class="linenos">292</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
+</span><span id="UISRNN-293"><a href="#UISRNN-293"><span class="linenos">293</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
+</span><span id="UISRNN-294"><a href="#UISRNN-294"><span class="linenos">294</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
+</span><span id="UISRNN-295"><a href="#UISRNN-295"><span class="linenos">295</span></a>      <span class="c1"># avoid numerical issues</span>
+</span><span id="UISRNN-296"><a href="#UISRNN-296"><span class="linenos">296</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
+</span><span id="UISRNN-297"><a href="#UISRNN-297"><span class="linenos">297</span></a>
+</span><span id="UISRNN-298"><a href="#UISRNN-298"><span class="linenos">298</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
+</span><span id="UISRNN-299"><a href="#UISRNN-299"><span class="linenos">299</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="UISRNN-300"><a href="#UISRNN-300"><span class="linenos">300</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-301"><a href="#UISRNN-301"><span class="linenos">301</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN-302"><a href="#UISRNN-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-303"><a href="#UISRNN-303"><span class="linenos">303</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-304"><a href="#UISRNN-304"><span class="linenos">304</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-305"><a href="#UISRNN-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN-306"><a href="#UISRNN-306"><span class="linenos">306</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN-307"><a href="#UISRNN-307"><span class="linenos">307</span></a>                <span class="n">num_iter</span><span class="p">,</span>
+</span><span id="UISRNN-308"><a href="#UISRNN-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN-309"><a href="#UISRNN-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN-310"><a href="#UISRNN-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN-311"><a href="#UISRNN-311"><span class="linenos">311</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
+</span><span id="UISRNN-312"><a href="#UISRNN-312"><span class="linenos">312</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
+</span><span id="UISRNN-313"><a href="#UISRNN-313"><span class="linenos">313</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-314"><a href="#UISRNN-314"><span class="linenos">314</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
+</span><span id="UISRNN-315"><a href="#UISRNN-315"><span class="linenos">315</span></a>
+</span><span id="UISRNN-316"><a href="#UISRNN-316"><span class="linenos">316</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-317"><a href="#UISRNN-317"><span class="linenos">317</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
+</span><span id="UISRNN-318"><a href="#UISRNN-318"><span class="linenos">318</span></a>
+</span><span id="UISRNN-319"><a href="#UISRNN-319"><span class="linenos">319</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-320"><a href="#UISRNN-320"><span class="linenos">320</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
+</span><span id="UISRNN-321"><a href="#UISRNN-321"><span class="linenos">321</span></a><span class="sd">        concatenated training sequence:</span>
+</span><span id="UISRNN-322"><a href="#UISRNN-322"><span class="linenos">322</span></a>
+</span><span id="UISRNN-323"><a href="#UISRNN-323"><span class="linenos">323</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
+</span><span id="UISRNN-324"><a href="#UISRNN-324"><span class="linenos">324</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
+</span><span id="UISRNN-325"><a href="#UISRNN-325"><span class="linenos">325</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
+</span><span id="UISRNN-326"><a href="#UISRNN-326"><span class="linenos">326</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
+</span><span id="UISRNN-327"><a href="#UISRNN-327"><span class="linenos">327</span></a><span class="sd">           embeddings of one utterance.</span>
+</span><span id="UISRNN-328"><a href="#UISRNN-328"><span class="linenos">328</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
+</span><span id="UISRNN-329"><a href="#UISRNN-329"><span class="linenos">329</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
+</span><span id="UISRNN-330"><a href="#UISRNN-330"><span class="linenos">330</span></a><span class="sd">           for more details.</span>
+</span><span id="UISRNN-331"><a href="#UISRNN-331"><span class="linenos">331</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
+</span><span id="UISRNN-332"><a href="#UISRNN-332"><span class="linenos">332</span></a>
+</span><span id="UISRNN-333"><a href="#UISRNN-333"><span class="linenos">333</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
+</span><span id="UISRNN-334"><a href="#UISRNN-334"><span class="linenos">334</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
+</span><span id="UISRNN-335"><a href="#UISRNN-335"><span class="linenos">335</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
+</span><span id="UISRNN-336"><a href="#UISRNN-336"><span class="linenos">336</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
+</span><span id="UISRNN-337"><a href="#UISRNN-337"><span class="linenos">337</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-338"><a href="#UISRNN-338"><span class="linenos">338</span></a>
+</span><span id="UISRNN-339"><a href="#UISRNN-339"><span class="linenos">339</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-340"><a href="#UISRNN-340"><span class="linenos">340</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
+</span><span id="UISRNN-341"><a href="#UISRNN-341"><span class="linenos">341</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-342"><a href="#UISRNN-342"><span class="linenos">342</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN-343"><a href="#UISRNN-343"><span class="linenos">343</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
+</span><span id="UISRNN-344"><a href="#UISRNN-344"><span class="linenos">344</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN-345"><a href="#UISRNN-345"><span class="linenos">345</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
+</span><span id="UISRNN-346"><a href="#UISRNN-346"><span class="linenos">346</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN-347"><a href="#UISRNN-347"><span class="linenos">347</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN-348"><a href="#UISRNN-348"><span class="linenos">348</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
+</span><span id="UISRNN-349"><a href="#UISRNN-349"><span class="linenos">349</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
+</span><span id="UISRNN-350"><a href="#UISRNN-350"><span class="linenos">350</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
+</span><span id="UISRNN-351"><a href="#UISRNN-351"><span class="linenos">351</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
+</span><span id="UISRNN-352"><a href="#UISRNN-352"><span class="linenos">352</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-353"><a href="#UISRNN-353"><span class="linenos">353</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
+</span><span id="UISRNN-354"><a href="#UISRNN-354"><span class="linenos">354</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
+</span><span id="UISRNN-355"><a href="#UISRNN-355"><span class="linenos">355</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN-356"><a href="#UISRNN-356"><span class="linenos">356</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
+</span><span id="UISRNN-357"><a href="#UISRNN-357"><span class="linenos">357</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
+</span><span id="UISRNN-358"><a href="#UISRNN-358"><span class="linenos">358</span></a>      <span class="k">pass</span>
+</span><span id="UISRNN-359"><a href="#UISRNN-359"><span class="linenos">359</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN-360"><a href="#UISRNN-360"><span class="linenos">360</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-361"><a href="#UISRNN-361"><span class="linenos">361</span></a>
+</span><span id="UISRNN-362"><a href="#UISRNN-362"><span class="linenos">362</span></a>    <span class="c1"># estimate transition_bias</span>
+</span><span id="UISRNN-363"><a href="#UISRNN-363"><span class="linenos">363</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN-364"><a href="#UISRNN-364"><span class="linenos">364</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN-365"><a href="#UISRNN-365"><span class="linenos">365</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
+</span><span id="UISRNN-366"><a href="#UISRNN-366"><span class="linenos">366</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
+</span><span id="UISRNN-367"><a href="#UISRNN-367"><span class="linenos">367</span></a>      <span class="c1"># set or update transition_bias</span>
+</span><span id="UISRNN-368"><a href="#UISRNN-368"><span class="linenos">368</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN-369"><a href="#UISRNN-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
+</span><span id="UISRNN-370"><a href="#UISRNN-370"><span class="linenos">370</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN-371"><a href="#UISRNN-371"><span class="linenos">371</span></a>      <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN-372"><a href="#UISRNN-372"><span class="linenos">372</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="UISRNN-373"><a href="#UISRNN-373"><span class="linenos">373</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
+</span><span id="UISRNN-374"><a href="#UISRNN-374"><span class="linenos">374</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="UISRNN-375"><a href="#UISRNN-375"><span class="linenos">375</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
+</span><span id="UISRNN-376"><a href="#UISRNN-376"><span class="linenos">376</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN-377"><a href="#UISRNN-377"><span class="linenos">377</span></a>
+</span><span id="UISRNN-378"><a href="#UISRNN-378"><span class="linenos">378</span></a>    <span class="c1"># concatenate train_sequences</span>
+</span><span id="UISRNN-379"><a href="#UISRNN-379"><span class="linenos">379</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN-380"><a href="#UISRNN-380"><span class="linenos">380</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
+</span><span id="UISRNN-381"><a href="#UISRNN-381"><span class="linenos">381</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
+</span><span id="UISRNN-382"><a href="#UISRNN-382"><span class="linenos">382</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
+</span><span id="UISRNN-383"><a href="#UISRNN-383"><span class="linenos">383</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
+</span><span id="UISRNN-384"><a href="#UISRNN-384"><span class="linenos">384</span></a>         <span class="kc">True</span><span class="p">)</span>
+</span><span id="UISRNN-385"><a href="#UISRNN-385"><span class="linenos">385</span></a>
+</span><span id="UISRNN-386"><a href="#UISRNN-386"><span class="linenos">386</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
+</span><span id="UISRNN-387"><a href="#UISRNN-387"><span class="linenos">387</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN-388"><a href="#UISRNN-388"><span class="linenos">388</span></a>
+</span><span id="UISRNN-389"><a href="#UISRNN-389"><span class="linenos">389</span></a>  <span class="k">def</span> <span class="nf">_update_beam_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">):</span>
+</span><span id="UISRNN-390"><a href="#UISRNN-390"><span class="linenos">390</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update a beam state given a look ahead sequence and known cluster</span>
+</span><span id="UISRNN-391"><a href="#UISRNN-391"><span class="linenos">391</span></a><span class="sd">    assignments.</span>
+</span><span id="UISRNN-392"><a href="#UISRNN-392"><span class="linenos">392</span></a>
+</span><span id="UISRNN-393"><a href="#UISRNN-393"><span class="linenos">393</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-394"><a href="#UISRNN-394"><span class="linenos">394</span></a><span class="sd">      beam_state: A BeamState object.</span>
+</span><span id="UISRNN-395"><a href="#UISRNN-395"><span class="linenos">395</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
+</span><span id="UISRNN-396"><a href="#UISRNN-396"><span class="linenos">396</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
+</span><span id="UISRNN-397"><a href="#UISRNN-397"><span class="linenos">397</span></a><span class="sd">        D: observation dimension</span>
+</span><span id="UISRNN-398"><a href="#UISRNN-398"><span class="linenos">398</span></a><span class="sd">      cluster_seq: Cluster assignment sequence for look_ahead_seq.</span>
+</span><span id="UISRNN-399"><a href="#UISRNN-399"><span class="linenos">399</span></a>
+</span><span id="UISRNN-400"><a href="#UISRNN-400"><span class="linenos">400</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-401"><a href="#UISRNN-401"><span class="linenos">401</span></a><span class="sd">      new_beam_state: An updated BeamState object.</span>
+</span><span id="UISRNN-402"><a href="#UISRNN-402"><span class="linenos">402</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-403"><a href="#UISRNN-403"><span class="linenos">403</span></a>
+</span><span id="UISRNN-404"><a href="#UISRNN-404"><span class="linenos">404</span></a>    <span class="n">loss</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="UISRNN-405"><a href="#UISRNN-405"><span class="linenos">405</span></a>    <span class="n">new_beam_state</span> <span class="o">=</span> <span class="n">BeamState</span><span class="p">(</span><span class="n">beam_state</span><span class="p">)</span>
+</span><span id="UISRNN-406"><a href="#UISRNN-406"><span class="linenos">406</span></a>    <span class="k">for</span> <span class="n">sub_idx</span><span class="p">,</span> <span class="n">cluster</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">cluster_seq</span><span class="p">):</span>
+</span><span id="UISRNN-407"><a href="#UISRNN-407"><span class="linenos">407</span></a>      <span class="k">if</span> <span class="n">cluster</span> <span class="o">&gt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># invalid trace</span>
+</span><span id="UISRNN-408"><a href="#UISRNN-408"><span class="linenos">408</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-409"><a href="#UISRNN-409"><span class="linenos">409</span></a>        <span class="k">break</span>
+</span><span id="UISRNN-410"><a href="#UISRNN-410"><span class="linenos">410</span></a>      <span class="k">elif</span> <span class="n">cluster</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">):</span>  <span class="c1"># existing cluster</span>
+</span><span id="UISRNN-411"><a href="#UISRNN-411"><span class="linenos">411</span></a>        <span class="n">last_cluster</span> <span class="o">=</span> <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="UISRNN-412"><a href="#UISRNN-412"><span class="linenos">412</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN-413"><a href="#UISRNN-413"><span class="linenos">413</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]),</span>
+</span><span id="UISRNN-414"><a href="#UISRNN-414"><span class="linenos">414</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
+</span><span id="UISRNN-415"><a href="#UISRNN-415"><span class="linenos">415</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
+</span><span id="UISRNN-416"><a href="#UISRNN-416"><span class="linenos">416</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">==</span> <span class="n">last_cluster</span><span class="p">:</span>
+</span><span id="UISRNN-417"><a href="#UISRNN-417"><span class="linenos">417</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span>
+</span><span id="UISRNN-418"><a href="#UISRNN-418"><span class="linenos">418</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN-419"><a href="#UISRNN-419"><span class="linenos">419</span></a>          <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-420"><a href="#UISRNN-420"><span class="linenos">420</span></a>              <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-421"><a href="#UISRNN-421"><span class="linenos">421</span></a>                  <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
+</span><span id="UISRNN-422"><a href="#UISRNN-422"><span class="linenos">422</span></a>        <span class="c1"># update new mean and new hidden</span>
+</span><span id="UISRNN-423"><a href="#UISRNN-423"><span class="linenos">423</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
+</span><span id="UISRNN-424"><a href="#UISRNN-424"><span class="linenos">424</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
+</span><span id="UISRNN-425"><a href="#UISRNN-425"><span class="linenos">425</span></a>            <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">])</span>
+</span><span id="UISRNN-426"><a href="#UISRNN-426"><span class="linenos">426</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span><span class="o">*</span><span class="p">(</span>
+</span><span id="UISRNN-427"><a href="#UISRNN-427"><span class="linenos">427</span></a>            <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span> <span class="o">-</span>
+</span><span id="UISRNN-428"><a href="#UISRNN-428"><span class="linenos">428</span></a>            <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span> <span class="o">+</span> <span class="n">mean</span><span class="o">.</span><span class="n">clone</span><span class="p">())</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="UISRNN-429"><a href="#UISRNN-429"><span class="linenos">429</span></a>                <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="p">)</span> <span class="o">==</span> <span class="n">cluster</span><span class="p">)</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span>
+</span><span id="UISRNN-430"><a href="#UISRNN-430"><span class="linenos">430</span></a>                    <span class="nb">float</span><span class="p">)</span>  <span class="c1"># use mean to predict</span>
+</span><span id="UISRNN-431"><a href="#UISRNN-431"><span class="linenos">431</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">hidden_set</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">=</span> <span class="n">hidden</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
+</span><span id="UISRNN-432"><a href="#UISRNN-432"><span class="linenos">432</span></a>        <span class="k">if</span> <span class="n">cluster</span> <span class="o">!=</span> <span class="n">last_cluster</span><span class="p">:</span>
+</span><span id="UISRNN-433"><a href="#UISRNN-433"><span class="linenos">433</span></a>          <span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">[</span><span class="n">cluster</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="UISRNN-434"><a href="#UISRNN-434"><span class="linenos">434</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">trace</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster</span><span class="p">)</span>
+</span><span id="UISRNN-435"><a href="#UISRNN-435"><span class="linenos">435</span></a>      <span class="k">else</span><span class="p">:</span>  <span class="c1"># new cluster</span>
+</span><span id="UISRNN-436"><a href="#UISRNN-436"><span class="linenos">436</span></a>        <span class="n">init_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="UISRNN-437"><a href="#UISRNN-437"><span class="linenos">437</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="UISRNN-438"><a href="#UISRNN-438"><span class="linenos">438</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-439"><a href="#UISRNN-439"><span class="linenos">439</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">init_input</span><span class="p">,</span>
+</span><span id="UISRNN-440"><a href="#UISRNN-440"><span class="linenos">440</span></a>                                      <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="p">)</span>
+</span><span id="UISRNN-441"><a href="#UISRNN-441"><span class="linenos">441</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN-442"><a href="#UISRNN-442"><span class="linenos">442</span></a>            <span class="n">input_tensor</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="n">mean</span><span class="p">),</span>
+</span><span id="UISRNN-443"><a href="#UISRNN-443"><span class="linenos">443</span></a>            <span class="n">target_tensor</span><span class="o">=</span><span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:],</span>
+</span><span id="UISRNN-444"><a href="#UISRNN-444"><span class="linenos">444</span></a>            <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()</span>
+</span><span id="UISRNN-445"><a href="#UISRNN-445"><span class="linenos">445</span></a>        <span class="n">loss</span> <span class="o">-=</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">)</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-446"><a href="#UISRNN-446"><span class="linenos">446</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="UISRNN-447"><a href="#UISRNN-447"><span class="linenos">447</span></a>                <span class="nb">sum</span><span class="p">(</span><span class="n">new_beam_state</span><span class="o">.</span><span class="n">block_counts</span><span class="p">)</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">)</span>
+</span><span id="UISRNN-448"><a href="#UISRNN-448"><span class="linenos">448</span></a>        <span class="c1"># update new min and new hidden</span>
+</span><span id="UISRNN-449"><a href="#UISRNN-449"><span class="linenos">449</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span>
+</span><span id="UISRNN-450"><a href="#UISRNN-450"><span class="linenos">450</span></a>            <span class="n">look_ahead_seq</span><span class="p">[</span><span class="n">sub_idx</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span>
+</span><span id="UISRNN-451"><a href="#UISRNN-451"><span class="linenos">451</span></a>            <span class="n">hidden</span><span class="p">)</span>
+</span><span id="UISRNN-452"><a href="#UISRNN-452"><span class="linenos">452</span></a>        <span class="n">new_beam_state</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">hidden</span><span class="p">,</span> <span class="n">cluster</span><span class="p">)</span>
+</span><span id="UISRNN-453"><a href="#UISRNN-453"><span class="linenos">453</span></a>      <span class="n">new_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span> <span class="o">+=</span> <span class="n">loss</span>
+</span><span id="UISRNN-454"><a href="#UISRNN-454"><span class="linenos">454</span></a>    <span class="k">return</span> <span class="n">new_beam_state</span>
+</span><span id="UISRNN-455"><a href="#UISRNN-455"><span class="linenos">455</span></a>
+</span><span id="UISRNN-456"><a href="#UISRNN-456"><span class="linenos">456</span></a>  <span class="k">def</span> <span class="nf">_calculate_score</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">):</span>
+</span><span id="UISRNN-457"><a href="#UISRNN-457"><span class="linenos">457</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Calculate negative log likelihoods for all possible state allocations</span>
+</span><span id="UISRNN-458"><a href="#UISRNN-458"><span class="linenos">458</span></a><span class="sd">       of a look ahead sequence, according to the current beam state.</span>
+</span><span id="UISRNN-459"><a href="#UISRNN-459"><span class="linenos">459</span></a>
+</span><span id="UISRNN-460"><a href="#UISRNN-460"><span class="linenos">460</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-461"><a href="#UISRNN-461"><span class="linenos">461</span></a><span class="sd">      beam_state: A BeamState object.</span>
+</span><span id="UISRNN-462"><a href="#UISRNN-462"><span class="linenos">462</span></a><span class="sd">      look_ahead_seq: Look ahead sequence, size: look_ahead*D.</span>
+</span><span id="UISRNN-463"><a href="#UISRNN-463"><span class="linenos">463</span></a><span class="sd">        look_ahead: number of step to look ahead in the beam search.</span>
+</span><span id="UISRNN-464"><a href="#UISRNN-464"><span class="linenos">464</span></a><span class="sd">        D: observation dimension</span>
+</span><span id="UISRNN-465"><a href="#UISRNN-465"><span class="linenos">465</span></a>
+</span><span id="UISRNN-466"><a href="#UISRNN-466"><span class="linenos">466</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-467"><a href="#UISRNN-467"><span class="linenos">467</span></a><span class="sd">      beam_score_set: a set of scores for each possible state allocation.</span>
+</span><span id="UISRNN-468"><a href="#UISRNN-468"><span class="linenos">468</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-469"><a href="#UISRNN-469"><span class="linenos">469</span></a>
+</span><span id="UISRNN-470"><a href="#UISRNN-470"><span class="linenos">470</span></a>    <span class="n">look_ahead</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN-471"><a href="#UISRNN-471"><span class="linenos">471</span></a>    <span class="n">beam_num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span>
+</span><span id="UISRNN-472"><a href="#UISRNN-472"><span class="linenos">472</span></a>    <span class="n">beam_score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="UISRNN-473"><a href="#UISRNN-473"><span class="linenos">473</span></a>        <span class="n">beam_num_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">look_ahead</span><span class="p">))</span>
+</span><span id="UISRNN-474"><a href="#UISRNN-474"><span class="linenos">474</span></a>    <span class="k">for</span> <span class="n">cluster_seq</span><span class="p">,</span> <span class="n">_</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">ndenumerate</span><span class="p">(</span><span class="n">beam_score_set</span><span class="p">):</span>
+</span><span id="UISRNN-475"><a href="#UISRNN-475"><span class="linenos">475</span></a>      <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span>
+</span><span id="UISRNN-476"><a href="#UISRNN-476"><span class="linenos">476</span></a>                                                   <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="UISRNN-477"><a href="#UISRNN-477"><span class="linenos">477</span></a>      <span class="n">beam_score_set</span><span class="p">[</span><span class="n">cluster_seq</span><span class="p">]</span> <span class="o">=</span> <span class="n">updated_beam_state</span><span class="o">.</span><span class="n">neg_likelihood</span>
+</span><span id="UISRNN-478"><a href="#UISRNN-478"><span class="linenos">478</span></a>    <span class="k">return</span> <span class="n">beam_score_set</span>
+</span><span id="UISRNN-479"><a href="#UISRNN-479"><span class="linenos">479</span></a>
+</span><span id="UISRNN-480"><a href="#UISRNN-480"><span class="linenos">480</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-481"><a href="#UISRNN-481"><span class="linenos">481</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
+</span><span id="UISRNN-482"><a href="#UISRNN-482"><span class="linenos">482</span></a>
+</span><span id="UISRNN-483"><a href="#UISRNN-483"><span class="linenos">483</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-484"><a href="#UISRNN-484"><span class="linenos">484</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
+</span><span id="UISRNN-485"><a href="#UISRNN-485"><span class="linenos">485</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN-486"><a href="#UISRNN-486"><span class="linenos">486</span></a>
+</span><span id="UISRNN-487"><a href="#UISRNN-487"><span class="linenos">487</span></a><span class="sd">        - `N`: length of one test utterance.</span>
+</span><span id="UISRNN-488"><a href="#UISRNN-488"><span class="linenos">488</span></a><span class="sd">        - `D` : observation dimension.</span>
+</span><span id="UISRNN-489"><a href="#UISRNN-489"><span class="linenos">489</span></a>
+</span><span id="UISRNN-490"><a href="#UISRNN-490"><span class="linenos">490</span></a><span class="sd">        For example:</span>
+</span><span id="UISRNN-491"><a href="#UISRNN-491"><span class="linenos">491</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-492"><a href="#UISRNN-492"><span class="linenos">492</span></a><span class="sd">      test_sequence =</span>
+</span><span id="UISRNN-493"><a href="#UISRNN-493"><span class="linenos">493</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-494"><a href="#UISRNN-494"><span class="linenos">494</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-495"><a href="#UISRNN-495"><span class="linenos">495</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-496"><a href="#UISRNN-496"><span class="linenos">496</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-497"><a href="#UISRNN-497"><span class="linenos">497</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN-498"><a href="#UISRNN-498"><span class="linenos">498</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN-499"><a href="#UISRNN-499"><span class="linenos">499</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN-500"><a href="#UISRNN-500"><span class="linenos">500</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-501"><a href="#UISRNN-501"><span class="linenos">501</span></a>
+</span><span id="UISRNN-502"><a href="#UISRNN-502"><span class="linenos">502</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-503"><a href="#UISRNN-503"><span class="linenos">503</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
+</span><span id="UISRNN-504"><a href="#UISRNN-504"><span class="linenos">504</span></a><span class="sd">        an array of integers, of size `N`.</span>
+</span><span id="UISRNN-505"><a href="#UISRNN-505"><span class="linenos">505</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
+</span><span id="UISRNN-506"><a href="#UISRNN-506"><span class="linenos">506</span></a>
+</span><span id="UISRNN-507"><a href="#UISRNN-507"><span class="linenos">507</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-508"><a href="#UISRNN-508"><span class="linenos">508</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
+</span><span id="UISRNN-509"><a href="#UISRNN-509"><span class="linenos">509</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
+</span><span id="UISRNN-510"><a href="#UISRNN-510"><span class="linenos">510</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-511"><a href="#UISRNN-511"><span class="linenos">511</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN-512"><a href="#UISRNN-512"><span class="linenos">512</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN-513"><a href="#UISRNN-513"><span class="linenos">513</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN-514"><a href="#UISRNN-514"><span class="linenos">514</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-515"><a href="#UISRNN-515"><span class="linenos">515</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN-516"><a href="#UISRNN-516"><span class="linenos">516</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN-517"><a href="#UISRNN-517"><span class="linenos">517</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-518"><a href="#UISRNN-518"><span class="linenos">518</span></a>    <span class="c1"># check size</span>
+</span><span id="UISRNN-519"><a href="#UISRNN-519"><span class="linenos">519</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN-520"><a href="#UISRNN-520"><span class="linenos">520</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN-521"><a href="#UISRNN-521"><span class="linenos">521</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN-522"><a href="#UISRNN-522"><span class="linenos">522</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN-523"><a href="#UISRNN-523"><span class="linenos">523</span></a>
+</span><span id="UISRNN-524"><a href="#UISRNN-524"><span class="linenos">524</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+</span><span id="UISRNN-525"><a href="#UISRNN-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN-526"><a href="#UISRNN-526"><span class="linenos">526</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="UISRNN-527"><a href="#UISRNN-527"><span class="linenos">527</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN-528"><a href="#UISRNN-528"><span class="linenos">528</span></a>    <span class="c1"># bookkeeping for beam search</span>
+</span><span id="UISRNN-529"><a href="#UISRNN-529"><span class="linenos">529</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
+</span><span id="UISRNN-530"><a href="#UISRNN-530"><span class="linenos">530</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
+</span><span id="UISRNN-531"><a href="#UISRNN-531"><span class="linenos">531</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
+</span><span id="UISRNN-532"><a href="#UISRNN-532"><span class="linenos">532</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
+</span><span id="UISRNN-533"><a href="#UISRNN-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
+</span><span id="UISRNN-534"><a href="#UISRNN-534"><span class="linenos">534</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="UISRNN-535"><a href="#UISRNN-535"><span class="linenos">535</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="UISRNN-536"><a href="#UISRNN-536"><span class="linenos">536</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="UISRNN-537"><a href="#UISRNN-537"><span class="linenos">537</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
+</span><span id="UISRNN-538"><a href="#UISRNN-538"><span class="linenos">538</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
+</span><span id="UISRNN-539"><a href="#UISRNN-539"><span class="linenos">539</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
+</span><span id="UISRNN-540"><a href="#UISRNN-540"><span class="linenos">540</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
+</span><span id="UISRNN-541"><a href="#UISRNN-541"><span class="linenos">541</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+</span><span id="UISRNN-542"><a href="#UISRNN-542"><span class="linenos">542</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
+</span><span id="UISRNN-543"><a href="#UISRNN-543"><span class="linenos">543</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
+</span><span id="UISRNN-544"><a href="#UISRNN-544"><span class="linenos">544</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
+</span><span id="UISRNN-545"><a href="#UISRNN-545"><span class="linenos">545</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
+</span><span id="UISRNN-546"><a href="#UISRNN-546"><span class="linenos">546</span></a>      <span class="c1"># find top scores</span>
+</span><span id="UISRNN-547"><a href="#UISRNN-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-548"><a href="#UISRNN-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="UISRNN-549"><a href="#UISRNN-549"><span class="linenos">549</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
+</span><span id="UISRNN-550"><a href="#UISRNN-550"><span class="linenos">550</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN-551"><a href="#UISRNN-551"><span class="linenos">551</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN-552"><a href="#UISRNN-552"><span class="linenos">552</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
+</span><span id="UISRNN-553"><a href="#UISRNN-553"><span class="linenos">553</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
+</span><span id="UISRNN-554"><a href="#UISRNN-554"><span class="linenos">554</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
+</span><span id="UISRNN-555"><a href="#UISRNN-555"><span class="linenos">555</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
+</span><span id="UISRNN-556"><a href="#UISRNN-556"><span class="linenos">556</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
+</span><span id="UISRNN-557"><a href="#UISRNN-557"><span class="linenos">557</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="UISRNN-558"><a href="#UISRNN-558"><span class="linenos">558</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
+</span><span id="UISRNN-559"><a href="#UISRNN-559"><span class="linenos">559</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="UISRNN-560"><a href="#UISRNN-560"><span class="linenos">560</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
+</span><span id="UISRNN-561"><a href="#UISRNN-561"><span class="linenos">561</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
+</span><span id="UISRNN-562"><a href="#UISRNN-562"><span class="linenos">562</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
+</span><span id="UISRNN-563"><a href="#UISRNN-563"><span class="linenos">563</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
+</span><span id="UISRNN-564"><a href="#UISRNN-564"><span class="linenos">564</span></a>
+</span><span id="UISRNN-565"><a href="#UISRNN-565"><span class="linenos">565</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN-566"><a href="#UISRNN-566"><span class="linenos">566</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
+</span><span id="UISRNN-567"><a href="#UISRNN-567"><span class="linenos">567</span></a>
+</span><span id="UISRNN-568"><a href="#UISRNN-568"><span class="linenos">568</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN-569"><a href="#UISRNN-569"><span class="linenos">569</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
+</span><span id="UISRNN-570"><a href="#UISRNN-570"><span class="linenos">570</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="UISRNN-571"><a href="#UISRNN-571"><span class="linenos">571</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
+</span><span id="UISRNN-572"><a href="#UISRNN-572"><span class="linenos">572</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN-573"><a href="#UISRNN-573"><span class="linenos">573</span></a>
+</span><span id="UISRNN-574"><a href="#UISRNN-574"><span class="linenos">574</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN-575"><a href="#UISRNN-575"><span class="linenos">575</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
+</span><span id="UISRNN-576"><a href="#UISRNN-576"><span class="linenos">576</span></a>
+</span><span id="UISRNN-577"><a href="#UISRNN-577"><span class="linenos">577</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
+</span><span id="UISRNN-578"><a href="#UISRNN-578"><span class="linenos">578</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
+</span><span id="UISRNN-579"><a href="#UISRNN-579"><span class="linenos">579</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
+</span><span id="UISRNN-580"><a href="#UISRNN-580"><span class="linenos">580</span></a><span class="sd">           be a 1-dim list of strings</span>
+</span><span id="UISRNN-581"><a href="#UISRNN-581"><span class="linenos">581</span></a>
+</span><span id="UISRNN-582"><a href="#UISRNN-582"><span class="linenos">582</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN-583"><a href="#UISRNN-583"><span class="linenos">583</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="UISRNN-584"><a href="#UISRNN-584"><span class="linenos">584</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN-585"><a href="#UISRNN-585"><span class="linenos">585</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN-586"><a href="#UISRNN-586"><span class="linenos">586</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN-587"><a href="#UISRNN-587"><span class="linenos">587</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN-588"><a href="#UISRNN-588"><span class="linenos">588</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN-589"><a href="#UISRNN-589"><span class="linenos">589</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN-590"><a href="#UISRNN-590"><span class="linenos">590</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
+</span><span id="UISRNN-591"><a href="#UISRNN-591"><span class="linenos">591</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1592,31 +1594,31 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN.__init__"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.__init__-83"><a href="#UISRNN.__init__-83"><span class="linenos"> 83</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.__init__-84"><a href="#UISRNN.__init__-84"><span class="linenos"> 84</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
-</span><span id="UISRNN.__init__-85"><a href="#UISRNN.__init__-85"><span class="linenos"> 85</span></a>
-</span><span id="UISRNN.__init__-86"><a href="#UISRNN.__init__-86"><span class="linenos"> 86</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.__init__-87"><a href="#UISRNN.__init__-87"><span class="linenos"> 87</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.__init__-88"><a href="#UISRNN.__init__-88"><span class="linenos"> 88</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.__init__-89"><a href="#UISRNN.__init__-89"><span class="linenos"> 89</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
-</span><span id="UISRNN.__init__-90"><a href="#UISRNN.__init__-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
-</span><span id="UISRNN.__init__-91"><a href="#UISRNN.__init__-91"><span class="linenos"> 91</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-92"><a href="#UISRNN.__init__-92"><span class="linenos"> 92</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="UISRNN.__init__-93"><a href="#UISRNN.__init__-93"><span class="linenos"> 93</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN.__init__-94"><a href="#UISRNN.__init__-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-95"><a href="#UISRNN.__init__-95"><span class="linenos"> 95</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.__init__-96"><a href="#UISRNN.__init__-96"><span class="linenos"> 96</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.__init__-97"><a href="#UISRNN.__init__-97"><span class="linenos"> 97</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
-</span><span id="UISRNN.__init__-98"><a href="#UISRNN.__init__-98"><span class="linenos"> 98</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-99"><a href="#UISRNN.__init__-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.__init__-100"><a href="#UISRNN.__init__-100"><span class="linenos">100</span></a>    <span class="c1"># initial values of variables</span>
-</span><span id="UISRNN.__init__-101"><a href="#UISRNN.__init__-101"><span class="linenos">101</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
-</span><span id="UISRNN.__init__-102"><a href="#UISRNN.__init__-102"><span class="linenos">102</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.__init__-103"><a href="#UISRNN.__init__-103"><span class="linenos">103</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.__init__-104"><a href="#UISRNN.__init__-104"><span class="linenos">104</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
-</span><span id="UISRNN.__init__-105"><a href="#UISRNN.__init__-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="UISRNN.__init__-106"><a href="#UISRNN.__init__-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
-</span><span id="UISRNN.__init__-107"><a href="#UISRNN.__init__-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.__init__-84"><a href="#UISRNN.__init__-84"><span class="linenos"> 84</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.__init__-85"><a href="#UISRNN.__init__-85"><span class="linenos"> 85</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct the UISRNN object.</span>
+</span><span id="UISRNN.__init__-86"><a href="#UISRNN.__init__-86"><span class="linenos"> 86</span></a>
+</span><span id="UISRNN.__init__-87"><a href="#UISRNN.__init__-87"><span class="linenos"> 87</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.__init__-88"><a href="#UISRNN.__init__-88"><span class="linenos"> 88</span></a><span class="sd">      args: Model configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.__init__-89"><a href="#UISRNN.__init__-89"><span class="linenos"> 89</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.__init__-90"><a href="#UISRNN.__init__-90"><span class="linenos"> 90</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">observation_dim</span>
+</span><span id="UISRNN.__init__-91"><a href="#UISRNN.__init__-91"><span class="linenos"> 91</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">device</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">(</span>
+</span><span id="UISRNN.__init__-92"><a href="#UISRNN.__init__-92"><span class="linenos"> 92</span></a>        <span class="s1">&#39;cuda:0&#39;</span> <span class="k">if</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">cuda</span><span class="o">.</span><span class="n">is_available</span><span class="p">()</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">enable_cuda</span><span class="p">)</span> <span class="k">else</span> <span class="s1">&#39;cpu&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-93"><a href="#UISRNN.__init__-93"><span class="linenos"> 93</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span> <span class="o">=</span> <span class="n">CoreRNN</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="UISRNN.__init__-94"><a href="#UISRNN.__init__-94"><span class="linenos"> 94</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN.__init__-95"><a href="#UISRNN.__init__-95"><span class="linenos"> 95</span></a>                             <span class="n">args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-96"><a href="#UISRNN.__init__-96"><span class="linenos"> 96</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.__init__-97"><a href="#UISRNN.__init__-97"><span class="linenos"> 97</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">zeros</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.__init__-98"><a href="#UISRNN.__init__-98"><span class="linenos"> 98</span></a>    <span class="c1"># booleans indicating which variables are trainable</span>
+</span><span id="UISRNN.__init__-99"><a href="#UISRNN.__init__-99"><span class="linenos"> 99</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">sigma2</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-100"><a href="#UISRNN.__init__-100"><span class="linenos">100</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span> <span class="o">=</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.__init__-101"><a href="#UISRNN.__init__-101"><span class="linenos">101</span></a>    <span class="c1"># initial values of variables</span>
+</span><span id="UISRNN.__init__-102"><a href="#UISRNN.__init__-102"><span class="linenos">102</span></a>    <span class="n">sigma2</span> <span class="o">=</span> <span class="n">_INITIAL_SIGMA2_VALUE</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_sigma2</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma2</span>
+</span><span id="UISRNN.__init__-103"><a href="#UISRNN.__init__-103"><span class="linenos">103</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.__init__-104"><a href="#UISRNN.__init__-104"><span class="linenos">104</span></a>        <span class="n">sigma2</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.__init__-105"><a href="#UISRNN.__init__-105"><span class="linenos">105</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">transition_bias</span>
+</span><span id="UISRNN.__init__-106"><a href="#UISRNN.__init__-106"><span class="linenos">106</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="UISRNN.__init__-107"><a href="#UISRNN.__init__-107"><span class="linenos">107</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">crp_alpha</span>
+</span><span id="UISRNN.__init__-108"><a href="#UISRNN.__init__-108"><span class="linenos">108</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">colortimelog</span><span class="o">.</span><span class="n">Logger</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verbosity</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1760,19 +1762,19 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN.save"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.save-135"><a href="#UISRNN.save-135"><span class="linenos">135</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN.save-136"><a href="#UISRNN.save-136"><span class="linenos">136</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
-</span><span id="UISRNN.save-137"><a href="#UISRNN.save-137"><span class="linenos">137</span></a>
-</span><span id="UISRNN.save-138"><a href="#UISRNN.save-138"><span class="linenos">138</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.save-139"><a href="#UISRNN.save-139"><span class="linenos">139</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN.save-140"><a href="#UISRNN.save-140"><span class="linenos">140</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.save-141"><a href="#UISRNN.save-141"><span class="linenos">141</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
-</span><span id="UISRNN.save-142"><a href="#UISRNN.save-142"><span class="linenos">142</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
-</span><span id="UISRNN.save-143"><a href="#UISRNN.save-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
-</span><span id="UISRNN.save-144"><a href="#UISRNN.save-144"><span class="linenos">144</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN.save-145"><a href="#UISRNN.save-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
-</span><span id="UISRNN.save-146"><a href="#UISRNN.save-146"><span class="linenos">146</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="UISRNN.save-147"><a href="#UISRNN.save-147"><span class="linenos">147</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.save-136"><a href="#UISRNN.save-136"><span class="linenos">136</span></a>  <span class="k">def</span> <span class="nf">save</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN.save-137"><a href="#UISRNN.save-137"><span class="linenos">137</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Save the model to a file.</span>
+</span><span id="UISRNN.save-138"><a href="#UISRNN.save-138"><span class="linenos">138</span></a>
+</span><span id="UISRNN.save-139"><a href="#UISRNN.save-139"><span class="linenos">139</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.save-140"><a href="#UISRNN.save-140"><span class="linenos">140</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN.save-141"><a href="#UISRNN.save-141"><span class="linenos">141</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.save-142"><a href="#UISRNN.save-142"><span class="linenos">142</span></a>    <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">({</span>
+</span><span id="UISRNN.save-143"><a href="#UISRNN.save-143"><span class="linenos">143</span></a>        <span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">state_dict</span><span class="p">(),</span>
+</span><span id="UISRNN.save-144"><a href="#UISRNN.save-144"><span class="linenos">144</span></a>        <span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">(),</span>
+</span><span id="UISRNN.save-145"><a href="#UISRNN.save-145"><span class="linenos">145</span></a>        <span class="s1">&#39;transition_bias&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN.save-146"><a href="#UISRNN.save-146"><span class="linenos">146</span></a>        <span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span><span class="p">,</span>
+</span><span id="UISRNN.save-147"><a href="#UISRNN.save-147"><span class="linenos">147</span></a>        <span class="s1">&#39;crp_alpha&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="UISRNN.save-148"><a href="#UISRNN.save-148"><span class="linenos">148</span></a>        <span class="s1">&#39;sigma2&#39;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">detach</span><span class="p">()</span><span class="o">.</span><span class="n">cpu</span><span class="p">()</span><span class="o">.</span><span class="n">numpy</span><span class="p">()},</span> <span class="n">filepath</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1795,28 +1797,28 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN.load"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.load-149"><a href="#UISRNN.load-149"><span class="linenos">149</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
-</span><span id="UISRNN.load-150"><a href="#UISRNN.load-150"><span class="linenos">150</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
-</span><span id="UISRNN.load-151"><a href="#UISRNN.load-151"><span class="linenos">151</span></a>
-</span><span id="UISRNN.load-152"><a href="#UISRNN.load-152"><span class="linenos">152</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.load-153"><a href="#UISRNN.load-153"><span class="linenos">153</span></a><span class="sd">      filepath: the path of the file.</span>
-</span><span id="UISRNN.load-154"><a href="#UISRNN.load-154"><span class="linenos">154</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.load-155"><a href="#UISRNN.load-155"><span class="linenos">155</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
-</span><span id="UISRNN.load-156"><a href="#UISRNN.load-156"><span class="linenos">156</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-157"><a href="#UISRNN.load-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.load-158"><a href="#UISRNN.load-158"><span class="linenos">158</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.load-159"><a href="#UISRNN.load-159"><span class="linenos">159</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-160"><a href="#UISRNN.load-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
-</span><span id="UISRNN.load-161"><a href="#UISRNN.load-161"><span class="linenos">161</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-162"><a href="#UISRNN.load-162"><span class="linenos">162</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
-</span><span id="UISRNN.load-163"><a href="#UISRNN.load-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-</span><span id="UISRNN.load-164"><a href="#UISRNN.load-164"><span class="linenos">164</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
-</span><span id="UISRNN.load-165"><a href="#UISRNN.load-165"><span class="linenos">165</span></a>
-</span><span id="UISRNN.load-166"><a href="#UISRNN.load-166"><span class="linenos">166</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.load-167"><a href="#UISRNN.load-167"><span class="linenos">167</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
-</span><span id="UISRNN.load-168"><a href="#UISRNN.load-168"><span class="linenos">168</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN.load-169"><a href="#UISRNN.load-169"><span class="linenos">169</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
-</span><span id="UISRNN.load-170"><a href="#UISRNN.load-170"><span class="linenos">170</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.load-150"><a href="#UISRNN.load-150"><span class="linenos">150</span></a>  <span class="k">def</span> <span class="nf">load</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">filepath</span><span class="p">):</span>
+</span><span id="UISRNN.load-151"><a href="#UISRNN.load-151"><span class="linenos">151</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Load the model from a file.</span>
+</span><span id="UISRNN.load-152"><a href="#UISRNN.load-152"><span class="linenos">152</span></a>
+</span><span id="UISRNN.load-153"><a href="#UISRNN.load-153"><span class="linenos">153</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.load-154"><a href="#UISRNN.load-154"><span class="linenos">154</span></a><span class="sd">      filepath: the path of the file.</span>
+</span><span id="UISRNN.load-155"><a href="#UISRNN.load-155"><span class="linenos">155</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.load-156"><a href="#UISRNN.load-156"><span class="linenos">156</span></a>    <span class="n">var_dict</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">filepath</span><span class="p">)</span>
+</span><span id="UISRNN.load-157"><a href="#UISRNN.load-157"><span class="linenos">157</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">load_state_dict</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_state_dict&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-158"><a href="#UISRNN.load-158"><span class="linenos">158</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.load-159"><a href="#UISRNN.load-159"><span class="linenos">159</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.load-160"><a href="#UISRNN.load-160"><span class="linenos">160</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-161"><a href="#UISRNN.load-161"><span class="linenos">161</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span>
+</span><span id="UISRNN.load-162"><a href="#UISRNN.load-162"><span class="linenos">162</span></a>        <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;transition_bias_denominator&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-163"><a href="#UISRNN.load-163"><span class="linenos">163</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;crp_alpha&#39;</span><span class="p">])</span>
+</span><span id="UISRNN.load-164"><a href="#UISRNN.load-164"><span class="linenos">164</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
+</span><span id="UISRNN.load-165"><a href="#UISRNN.load-165"><span class="linenos">165</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="UISRNN.load-166"><a href="#UISRNN.load-166"><span class="linenos">166</span></a>
+</span><span id="UISRNN.load-167"><a href="#UISRNN.load-167"><span class="linenos">167</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.load-168"><a href="#UISRNN.load-168"><span class="linenos">168</span></a>        <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;Loaded model with transition_bias=</span><span class="si">{}</span><span class="s1">, crp_alpha=</span><span class="si">{}</span><span class="s1">, sigma2=</span><span class="si">{}</span><span class="s1">, &#39;</span>
+</span><span id="UISRNN.load-169"><a href="#UISRNN.load-169"><span class="linenos">169</span></a>        <span class="s1">&#39;rnn_init_hidden=</span><span class="si">{}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN.load-170"><a href="#UISRNN.load-170"><span class="linenos">170</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span> <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;sigma2&#39;</span><span class="p">],</span>
+</span><span id="UISRNN.load-171"><a href="#UISRNN.load-171"><span class="linenos">171</span></a>            <span class="n">var_dict</span><span class="p">[</span><span class="s1">&#39;rnn_init_hidden&#39;</span><span class="p">]))</span>
 </span></pre></div>
 
 
@@ -1839,148 +1841,148 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN.fit_concatenated"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit_concatenated-172"><a href="#UISRNN.fit_concatenated-172"><span class="linenos">172</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-173"><a href="#UISRNN.fit_concatenated-173"><span class="linenos">173</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
-</span><span id="UISRNN.fit_concatenated-174"><a href="#UISRNN.fit_concatenated-174"><span class="linenos">174</span></a>
-</span><span id="UISRNN.fit_concatenated-175"><a href="#UISRNN.fit_concatenated-175"><span class="linenos">175</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.fit_concatenated-176"><a href="#UISRNN.fit_concatenated-176"><span class="linenos">176</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
-</span><span id="UISRNN.fit_concatenated-177"><a href="#UISRNN.fit_concatenated-177"><span class="linenos">177</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN.fit_concatenated-178"><a href="#UISRNN.fit_concatenated-178"><span class="linenos">178</span></a>
-</span><span id="UISRNN.fit_concatenated-179"><a href="#UISRNN.fit_concatenated-179"><span class="linenos">179</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
-</span><span id="UISRNN.fit_concatenated-180"><a href="#UISRNN.fit_concatenated-180"><span class="linenos">180</span></a><span class="sd">        - `D`: observation dimension.</span>
-</span><span id="UISRNN.fit_concatenated-181"><a href="#UISRNN.fit_concatenated-181"><span class="linenos">181</span></a>
-</span><span id="UISRNN.fit_concatenated-182"><a href="#UISRNN.fit_concatenated-182"><span class="linenos">182</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN.fit_concatenated-183"><a href="#UISRNN.fit_concatenated-183"><span class="linenos">183</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-184"><a href="#UISRNN.fit_concatenated-184"><span class="linenos">184</span></a><span class="sd">      train_sequence =</span>
-</span><span id="UISRNN.fit_concatenated-185"><a href="#UISRNN.fit_concatenated-185"><span class="linenos">185</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN.fit_concatenated-186"><a href="#UISRNN.fit_concatenated-186"><span class="linenos">186</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN.fit_concatenated-187"><a href="#UISRNN.fit_concatenated-187"><span class="linenos">187</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
-</span><span id="UISRNN.fit_concatenated-188"><a href="#UISRNN.fit_concatenated-188"><span class="linenos">188</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN.fit_concatenated-189"><a href="#UISRNN.fit_concatenated-189"><span class="linenos">189</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
-</span><span id="UISRNN.fit_concatenated-190"><a href="#UISRNN.fit_concatenated-190"><span class="linenos">190</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-191"><a href="#UISRNN.fit_concatenated-191"><span class="linenos">191</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN.fit_concatenated-192"><a href="#UISRNN.fit_concatenated-192"><span class="linenos">192</span></a>
-</span><span id="UISRNN.fit_concatenated-193"><a href="#UISRNN.fit_concatenated-193"><span class="linenos">193</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
-</span><span id="UISRNN.fit_concatenated-194"><a href="#UISRNN.fit_concatenated-194"><span class="linenos">194</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
-</span><span id="UISRNN.fit_concatenated-195"><a href="#UISRNN.fit_concatenated-195"><span class="linenos">195</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
-</span><span id="UISRNN.fit_concatenated-196"><a href="#UISRNN.fit_concatenated-196"><span class="linenos">196</span></a><span class="sd">        For example,</span>
-</span><span id="UISRNN.fit_concatenated-197"><a href="#UISRNN.fit_concatenated-197"><span class="linenos">197</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-198"><a href="#UISRNN.fit_concatenated-198"><span class="linenos">198</span></a><span class="sd">      train_cluster_id =</span>
-</span><span id="UISRNN.fit_concatenated-199"><a href="#UISRNN.fit_concatenated-199"><span class="linenos">199</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
-</span><span id="UISRNN.fit_concatenated-200"><a href="#UISRNN.fit_concatenated-200"><span class="linenos">200</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.fit_concatenated-201"><a href="#UISRNN.fit_concatenated-201"><span class="linenos">201</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
-</span><span id="UISRNN.fit_concatenated-202"><a href="#UISRNN.fit_concatenated-202"><span class="linenos">202</span></a>
-</span><span id="UISRNN.fit_concatenated-203"><a href="#UISRNN.fit_concatenated-203"><span class="linenos">203</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
-</span><span id="UISRNN.fit_concatenated-204"><a href="#UISRNN.fit_concatenated-204"><span class="linenos">204</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
-</span><span id="UISRNN.fit_concatenated-205"><a href="#UISRNN.fit_concatenated-205"><span class="linenos">205</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.fit_concatenated-206"><a href="#UISRNN.fit_concatenated-206"><span class="linenos">206</span></a>
-</span><span id="UISRNN.fit_concatenated-207"><a href="#UISRNN.fit_concatenated-207"><span class="linenos">207</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.fit_concatenated-208"><a href="#UISRNN.fit_concatenated-208"><span class="linenos">208</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
-</span><span id="UISRNN.fit_concatenated-209"><a href="#UISRNN.fit_concatenated-209"><span class="linenos">209</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
-</span><span id="UISRNN.fit_concatenated-210"><a href="#UISRNN.fit_concatenated-210"><span class="linenos">210</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.fit_concatenated-211"><a href="#UISRNN.fit_concatenated-211"><span class="linenos">211</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN.fit_concatenated-212"><a href="#UISRNN.fit_concatenated-212"><span class="linenos">212</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN.fit_concatenated-213"><a href="#UISRNN.fit_concatenated-213"><span class="linenos">213</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-214"><a href="#UISRNN.fit_concatenated-214"><span class="linenos">214</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-215"><a href="#UISRNN.fit_concatenated-215"><span class="linenos">215</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-216"><a href="#UISRNN.fit_concatenated-216"><span class="linenos">216</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-217"><a href="#UISRNN.fit_concatenated-217"><span class="linenos">217</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN.fit_concatenated-218"><a href="#UISRNN.fit_concatenated-218"><span class="linenos">218</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
-</span><span id="UISRNN.fit_concatenated-219"><a href="#UISRNN.fit_concatenated-219"><span class="linenos">219</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-220"><a href="#UISRNN.fit_concatenated-220"><span class="linenos">220</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN.fit_concatenated-221"><a href="#UISRNN.fit_concatenated-221"><span class="linenos">221</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-222"><a href="#UISRNN.fit_concatenated-222"><span class="linenos">222</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-223"><a href="#UISRNN.fit_concatenated-223"><span class="linenos">223</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-224"><a href="#UISRNN.fit_concatenated-224"><span class="linenos">224</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-225"><a href="#UISRNN.fit_concatenated-225"><span class="linenos">225</span></a>    <span class="c1"># check length and size</span>
-</span><span id="UISRNN.fit_concatenated-226"><a href="#UISRNN.fit_concatenated-226"><span class="linenos">226</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN.fit_concatenated-227"><a href="#UISRNN.fit_concatenated-227"><span class="linenos">227</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-228"><a href="#UISRNN.fit_concatenated-228"><span class="linenos">228</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN.fit_concatenated-229"><a href="#UISRNN.fit_concatenated-229"><span class="linenos">229</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-230"><a href="#UISRNN.fit_concatenated-230"><span class="linenos">230</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-231"><a href="#UISRNN.fit_concatenated-231"><span class="linenos">231</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
-</span><span id="UISRNN.fit_concatenated-232"><a href="#UISRNN.fit_concatenated-232"><span class="linenos">232</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-233"><a href="#UISRNN.fit_concatenated-233"><span class="linenos">233</span></a>
-</span><span id="UISRNN.fit_concatenated-234"><a href="#UISRNN.fit_concatenated-234"><span class="linenos">234</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-235"><a href="#UISRNN.fit_concatenated-235"><span class="linenos">235</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-236"><a href="#UISRNN.fit_concatenated-236"><span class="linenos">236</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-237"><a href="#UISRNN.fit_concatenated-237"><span class="linenos">237</span></a>
-</span><span id="UISRNN.fit_concatenated-238"><a href="#UISRNN.fit_concatenated-238"><span class="linenos">238</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-239"><a href="#UISRNN.fit_concatenated-239"><span class="linenos">239</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-240"><a href="#UISRNN.fit_concatenated-240"><span class="linenos">240</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-241"><a href="#UISRNN.fit_concatenated-241"><span class="linenos">241</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-242"><a href="#UISRNN.fit_concatenated-242"><span class="linenos">242</span></a>
-</span><span id="UISRNN.fit_concatenated-243"><a href="#UISRNN.fit_concatenated-243"><span class="linenos">243</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
-</span><span id="UISRNN.fit_concatenated-244"><a href="#UISRNN.fit_concatenated-244"><span class="linenos">244</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-245"><a href="#UISRNN.fit_concatenated-245"><span class="linenos">245</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-246"><a href="#UISRNN.fit_concatenated-246"><span class="linenos">246</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-247"><a href="#UISRNN.fit_concatenated-247"><span class="linenos">247</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-248"><a href="#UISRNN.fit_concatenated-248"><span class="linenos">248</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-249"><a href="#UISRNN.fit_concatenated-249"><span class="linenos">249</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-250"><a href="#UISRNN.fit_concatenated-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-251"><a href="#UISRNN.fit_concatenated-251"><span class="linenos">251</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN.fit_concatenated-252"><a href="#UISRNN.fit_concatenated-252"><span class="linenos">252</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-253"><a href="#UISRNN.fit_concatenated-253"><span class="linenos">253</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-254"><a href="#UISRNN.fit_concatenated-254"><span class="linenos">254</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
-</span><span id="UISRNN.fit_concatenated-255"><a href="#UISRNN.fit_concatenated-255"><span class="linenos">255</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN.fit_concatenated-256"><a href="#UISRNN.fit_concatenated-256"><span class="linenos">256</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-257"><a href="#UISRNN.fit_concatenated-257"><span class="linenos">257</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-258"><a href="#UISRNN.fit_concatenated-258"><span class="linenos">258</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-259"><a href="#UISRNN.fit_concatenated-259"><span class="linenos">259</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-260"><a href="#UISRNN.fit_concatenated-260"><span class="linenos">260</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-261"><a href="#UISRNN.fit_concatenated-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-262"><a href="#UISRNN.fit_concatenated-262"><span class="linenos">262</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-263"><a href="#UISRNN.fit_concatenated-263"><span class="linenos">263</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-264"><a href="#UISRNN.fit_concatenated-264"><span class="linenos">264</span></a>      <span class="c1"># use mean to predict</span>
-</span><span id="UISRNN.fit_concatenated-265"><a href="#UISRNN.fit_concatenated-265"><span class="linenos">265</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-266"><a href="#UISRNN.fit_concatenated-266"><span class="linenos">266</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-267"><a href="#UISRNN.fit_concatenated-267"><span class="linenos">267</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-268"><a href="#UISRNN.fit_concatenated-268"><span class="linenos">268</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-269"><a href="#UISRNN.fit_concatenated-269"><span class="linenos">269</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
-</span><span id="UISRNN.fit_concatenated-270"><a href="#UISRNN.fit_concatenated-270"><span class="linenos">270</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN.fit_concatenated-271"><a href="#UISRNN.fit_concatenated-271"><span class="linenos">271</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-272"><a href="#UISRNN.fit_concatenated-272"><span class="linenos">272</span></a>
-</span><span id="UISRNN.fit_concatenated-273"><a href="#UISRNN.fit_concatenated-273"><span class="linenos">273</span></a>      <span class="c1"># Likelihood part.</span>
-</span><span id="UISRNN.fit_concatenated-274"><a href="#UISRNN.fit_concatenated-274"><span class="linenos">274</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-275"><a href="#UISRNN.fit_concatenated-275"><span class="linenos">275</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
-</span><span id="UISRNN.fit_concatenated-276"><a href="#UISRNN.fit_concatenated-276"><span class="linenos">276</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-277"><a href="#UISRNN.fit_concatenated-277"><span class="linenos">277</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
-</span><span id="UISRNN.fit_concatenated-278"><a href="#UISRNN.fit_concatenated-278"><span class="linenos">278</span></a>
-</span><span id="UISRNN.fit_concatenated-279"><a href="#UISRNN.fit_concatenated-279"><span class="linenos">279</span></a>      <span class="c1"># Sigma2 prior part.</span>
-</span><span id="UISRNN.fit_concatenated-280"><a href="#UISRNN.fit_concatenated-280"><span class="linenos">280</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-281"><a href="#UISRNN.fit_concatenated-281"><span class="linenos">281</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-282"><a href="#UISRNN.fit_concatenated-282"><span class="linenos">282</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-283"><a href="#UISRNN.fit_concatenated-283"><span class="linenos">283</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-284"><a href="#UISRNN.fit_concatenated-284"><span class="linenos">284</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-285"><a href="#UISRNN.fit_concatenated-285"><span class="linenos">285</span></a>
-</span><span id="UISRNN.fit_concatenated-286"><a href="#UISRNN.fit_concatenated-286"><span class="linenos">286</span></a>      <span class="c1"># Regularization part.</span>
-</span><span id="UISRNN.fit_concatenated-287"><a href="#UISRNN.fit_concatenated-287"><span class="linenos">287</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-288"><a href="#UISRNN.fit_concatenated-288"><span class="linenos">288</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-289"><a href="#UISRNN.fit_concatenated-289"><span class="linenos">289</span></a>
-</span><span id="UISRNN.fit_concatenated-290"><a href="#UISRNN.fit_concatenated-290"><span class="linenos">290</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
-</span><span id="UISRNN.fit_concatenated-291"><a href="#UISRNN.fit_concatenated-291"><span class="linenos">291</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-292"><a href="#UISRNN.fit_concatenated-292"><span class="linenos">292</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-293"><a href="#UISRNN.fit_concatenated-293"><span class="linenos">293</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
-</span><span id="UISRNN.fit_concatenated-294"><a href="#UISRNN.fit_concatenated-294"><span class="linenos">294</span></a>      <span class="c1"># avoid numerical issues</span>
-</span><span id="UISRNN.fit_concatenated-295"><a href="#UISRNN.fit_concatenated-295"><span class="linenos">295</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
-</span><span id="UISRNN.fit_concatenated-296"><a href="#UISRNN.fit_concatenated-296"><span class="linenos">296</span></a>
-</span><span id="UISRNN.fit_concatenated-297"><a href="#UISRNN.fit_concatenated-297"><span class="linenos">297</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
-</span><span id="UISRNN.fit_concatenated-298"><a href="#UISRNN.fit_concatenated-298"><span class="linenos">298</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="UISRNN.fit_concatenated-299"><a href="#UISRNN.fit_concatenated-299"><span class="linenos">299</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-300"><a href="#UISRNN.fit_concatenated-300"><span class="linenos">300</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-301"><a href="#UISRNN.fit_concatenated-301"><span class="linenos">301</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-302"><a href="#UISRNN.fit_concatenated-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-303"><a href="#UISRNN.fit_concatenated-303"><span class="linenos">303</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-304"><a href="#UISRNN.fit_concatenated-304"><span class="linenos">304</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
-</span><span id="UISRNN.fit_concatenated-305"><a href="#UISRNN.fit_concatenated-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-306"><a href="#UISRNN.fit_concatenated-306"><span class="linenos">306</span></a>                <span class="n">num_iter</span><span class="p">,</span>
-</span><span id="UISRNN.fit_concatenated-307"><a href="#UISRNN.fit_concatenated-307"><span class="linenos">307</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN.fit_concatenated-308"><a href="#UISRNN.fit_concatenated-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN.fit_concatenated-309"><a href="#UISRNN.fit_concatenated-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
-</span><span id="UISRNN.fit_concatenated-310"><a href="#UISRNN.fit_concatenated-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
-</span><span id="UISRNN.fit_concatenated-311"><a href="#UISRNN.fit_concatenated-311"><span class="linenos">311</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
-</span><span id="UISRNN.fit_concatenated-312"><a href="#UISRNN.fit_concatenated-312"><span class="linenos">312</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.fit_concatenated-313"><a href="#UISRNN.fit_concatenated-313"><span class="linenos">313</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit_concatenated-173"><a href="#UISRNN.fit_concatenated-173"><span class="linenos">173</span></a>  <span class="k">def</span> <span class="nf">fit_concatenated</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-174"><a href="#UISRNN.fit_concatenated-174"><span class="linenos">174</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model to concatenated sequence and cluster_id.</span>
+</span><span id="UISRNN.fit_concatenated-175"><a href="#UISRNN.fit_concatenated-175"><span class="linenos">175</span></a>
+</span><span id="UISRNN.fit_concatenated-176"><a href="#UISRNN.fit_concatenated-176"><span class="linenos">176</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.fit_concatenated-177"><a href="#UISRNN.fit_concatenated-177"><span class="linenos">177</span></a><span class="sd">      train_sequence: the training observation sequence, which is a</span>
+</span><span id="UISRNN.fit_concatenated-178"><a href="#UISRNN.fit_concatenated-178"><span class="linenos">178</span></a><span class="sd">        2-dim numpy array of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN.fit_concatenated-179"><a href="#UISRNN.fit_concatenated-179"><span class="linenos">179</span></a>
+</span><span id="UISRNN.fit_concatenated-180"><a href="#UISRNN.fit_concatenated-180"><span class="linenos">180</span></a><span class="sd">        - `N`: summation of lengths of all utterances.</span>
+</span><span id="UISRNN.fit_concatenated-181"><a href="#UISRNN.fit_concatenated-181"><span class="linenos">181</span></a><span class="sd">        - `D`: observation dimension.</span>
+</span><span id="UISRNN.fit_concatenated-182"><a href="#UISRNN.fit_concatenated-182"><span class="linenos">182</span></a>
+</span><span id="UISRNN.fit_concatenated-183"><a href="#UISRNN.fit_concatenated-183"><span class="linenos">183</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN.fit_concatenated-184"><a href="#UISRNN.fit_concatenated-184"><span class="linenos">184</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-185"><a href="#UISRNN.fit_concatenated-185"><span class="linenos">185</span></a><span class="sd">      train_sequence =</span>
+</span><span id="UISRNN.fit_concatenated-186"><a href="#UISRNN.fit_concatenated-186"><span class="linenos">186</span></a><span class="sd">      [[1.2 3.0 -4.1 6.0]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN.fit_concatenated-187"><a href="#UISRNN.fit_concatenated-187"><span class="linenos">187</span></a><span class="sd">       [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN.fit_concatenated-188"><a href="#UISRNN.fit_concatenated-188"><span class="linenos">188</span></a><span class="sd">       [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance &#39;iaaa&#39;</span>
+</span><span id="UISRNN.fit_concatenated-189"><a href="#UISRNN.fit_concatenated-189"><span class="linenos">189</span></a><span class="sd">       [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN.fit_concatenated-190"><a href="#UISRNN.fit_concatenated-190"><span class="linenos">190</span></a><span class="sd">       [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance &#39;ibbb&#39;</span>
+</span><span id="UISRNN.fit_concatenated-191"><a href="#UISRNN.fit_concatenated-191"><span class="linenos">191</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-192"><a href="#UISRNN.fit_concatenated-192"><span class="linenos">192</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN.fit_concatenated-193"><a href="#UISRNN.fit_concatenated-193"><span class="linenos">193</span></a>
+</span><span id="UISRNN.fit_concatenated-194"><a href="#UISRNN.fit_concatenated-194"><span class="linenos">194</span></a><span class="sd">        We concatenate all training utterances into this single sequence.</span>
+</span><span id="UISRNN.fit_concatenated-195"><a href="#UISRNN.fit_concatenated-195"><span class="linenos">195</span></a><span class="sd">      train_cluster_id: the speaker id sequence, which is 1-dim list or</span>
+</span><span id="UISRNN.fit_concatenated-196"><a href="#UISRNN.fit_concatenated-196"><span class="linenos">196</span></a><span class="sd">        numpy array of strings, of size `N`.</span>
+</span><span id="UISRNN.fit_concatenated-197"><a href="#UISRNN.fit_concatenated-197"><span class="linenos">197</span></a><span class="sd">        For example,</span>
+</span><span id="UISRNN.fit_concatenated-198"><a href="#UISRNN.fit_concatenated-198"><span class="linenos">198</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-199"><a href="#UISRNN.fit_concatenated-199"><span class="linenos">199</span></a><span class="sd">      train_cluster_id =</span>
+</span><span id="UISRNN.fit_concatenated-200"><a href="#UISRNN.fit_concatenated-200"><span class="linenos">200</span></a><span class="sd">        [&#39;iaaa_0&#39;, &#39;iaaa_1&#39;, &#39;iaaa_0&#39;, &#39;ibbb_0&#39;, &#39;ibbb_0&#39;]</span>
+</span><span id="UISRNN.fit_concatenated-201"><a href="#UISRNN.fit_concatenated-201"><span class="linenos">201</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.fit_concatenated-202"><a href="#UISRNN.fit_concatenated-202"><span class="linenos">202</span></a><span class="sd">        &#39;iaaa_0&#39; means the entry belongs to speaker #0 in utterance &#39;iaaa&#39;.</span>
+</span><span id="UISRNN.fit_concatenated-203"><a href="#UISRNN.fit_concatenated-203"><span class="linenos">203</span></a>
+</span><span id="UISRNN.fit_concatenated-204"><a href="#UISRNN.fit_concatenated-204"><span class="linenos">204</span></a><span class="sd">        Note that the order of entries within an utterance are preserved,</span>
+</span><span id="UISRNN.fit_concatenated-205"><a href="#UISRNN.fit_concatenated-205"><span class="linenos">205</span></a><span class="sd">        and all utterances are simply concatenated together.</span>
+</span><span id="UISRNN.fit_concatenated-206"><a href="#UISRNN.fit_concatenated-206"><span class="linenos">206</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.fit_concatenated-207"><a href="#UISRNN.fit_concatenated-207"><span class="linenos">207</span></a>
+</span><span id="UISRNN.fit_concatenated-208"><a href="#UISRNN.fit_concatenated-208"><span class="linenos">208</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.fit_concatenated-209"><a href="#UISRNN.fit_concatenated-209"><span class="linenos">209</span></a><span class="sd">      TypeError: If train_sequence or train_cluster_id is of wrong type.</span>
+</span><span id="UISRNN.fit_concatenated-210"><a href="#UISRNN.fit_concatenated-210"><span class="linenos">210</span></a><span class="sd">      ValueError: If train_sequence or train_cluster_id has wrong dimension.</span>
+</span><span id="UISRNN.fit_concatenated-211"><a href="#UISRNN.fit_concatenated-211"><span class="linenos">211</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.fit_concatenated-212"><a href="#UISRNN.fit_concatenated-212"><span class="linenos">212</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN.fit_concatenated-213"><a href="#UISRNN.fit_concatenated-213"><span class="linenos">213</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN.fit_concatenated-214"><a href="#UISRNN.fit_concatenated-214"><span class="linenos">214</span></a>        <span class="n">train_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-215"><a href="#UISRNN.fit_concatenated-215"><span class="linenos">215</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-216"><a href="#UISRNN.fit_concatenated-216"><span class="linenos">216</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-217"><a href="#UISRNN.fit_concatenated-217"><span class="linenos">217</span></a>      <span class="n">train_cluster_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-218"><a href="#UISRNN.fit_concatenated-218"><span class="linenos">218</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN.fit_concatenated-219"><a href="#UISRNN.fit_concatenated-219"><span class="linenos">219</span></a>        <span class="ow">not</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">dtype</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">((</span><span class="s1">&#39;str&#39;</span><span class="p">,</span> <span class="s1">&#39;unicode&#39;</span><span class="p">))):</span>
+</span><span id="UISRNN.fit_concatenated-220"><a href="#UISRNN.fit_concatenated-220"><span class="linenos">220</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id type be a numpy array of strings.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-221"><a href="#UISRNN.fit_concatenated-221"><span class="linenos">221</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN.fit_concatenated-222"><a href="#UISRNN.fit_concatenated-222"><span class="linenos">222</span></a>    <span class="k">if</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-223"><a href="#UISRNN.fit_concatenated-223"><span class="linenos">223</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-224"><a href="#UISRNN.fit_concatenated-224"><span class="linenos">224</span></a>    <span class="k">if</span> <span class="n">train_cluster_id</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-225"><a href="#UISRNN.fit_concatenated-225"><span class="linenos">225</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_cluster_id must be 1-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-226"><a href="#UISRNN.fit_concatenated-226"><span class="linenos">226</span></a>    <span class="c1"># check length and size</span>
+</span><span id="UISRNN.fit_concatenated-227"><a href="#UISRNN.fit_concatenated-227"><span class="linenos">227</span></a>    <span class="n">train_total_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN.fit_concatenated-228"><a href="#UISRNN.fit_concatenated-228"><span class="linenos">228</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-229"><a href="#UISRNN.fit_concatenated-229"><span class="linenos">229</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN.fit_concatenated-230"><a href="#UISRNN.fit_concatenated-230"><span class="linenos">230</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-231"><a href="#UISRNN.fit_concatenated-231"><span class="linenos">231</span></a>    <span class="k">if</span> <span class="n">train_total_length</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-232"><a href="#UISRNN.fit_concatenated-232"><span class="linenos">232</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;train_sequence length is not equal to &#39;</span>
+</span><span id="UISRNN.fit_concatenated-233"><a href="#UISRNN.fit_concatenated-233"><span class="linenos">233</span></a>                       <span class="s1">&#39;train_cluster_id length.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-234"><a href="#UISRNN.fit_concatenated-234"><span class="linenos">234</span></a>
+</span><span id="UISRNN.fit_concatenated-235"><a href="#UISRNN.fit_concatenated-235"><span class="linenos">235</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">train</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-236"><a href="#UISRNN.fit_concatenated-236"><span class="linenos">236</span></a>    <span class="n">optimizer</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_optimizer</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">optimizer</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-237"><a href="#UISRNN.fit_concatenated-237"><span class="linenos">237</span></a>                                    <span class="n">learning_rate</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-238"><a href="#UISRNN.fit_concatenated-238"><span class="linenos">238</span></a>
+</span><span id="UISRNN.fit_concatenated-239"><a href="#UISRNN.fit_concatenated-239"><span class="linenos">239</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">resize_sequence</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-240"><a href="#UISRNN.fit_concatenated-240"><span class="linenos">240</span></a>        <span class="n">sequence</span><span class="o">=</span><span class="n">train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-241"><a href="#UISRNN.fit_concatenated-241"><span class="linenos">241</span></a>        <span class="n">cluster_id</span><span class="o">=</span><span class="n">train_cluster_id</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-242"><a href="#UISRNN.fit_concatenated-242"><span class="linenos">242</span></a>        <span class="n">num_permutations</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">num_permutations</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-243"><a href="#UISRNN.fit_concatenated-243"><span class="linenos">243</span></a>
+</span><span id="UISRNN.fit_concatenated-244"><a href="#UISRNN.fit_concatenated-244"><span class="linenos">244</span></a>    <span class="c1"># For batch learning, pack the entire dataset.</span>
+</span><span id="UISRNN.fit_concatenated-245"><a href="#UISRNN.fit_concatenated-245"><span class="linenos">245</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-246"><a href="#UISRNN.fit_concatenated-246"><span class="linenos">246</span></a>      <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-247"><a href="#UISRNN.fit_concatenated-247"><span class="linenos">247</span></a>          <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-248"><a href="#UISRNN.fit_concatenated-248"><span class="linenos">248</span></a>          <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-249"><a href="#UISRNN.fit_concatenated-249"><span class="linenos">249</span></a>          <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-250"><a href="#UISRNN.fit_concatenated-250"><span class="linenos">250</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-251"><a href="#UISRNN.fit_concatenated-251"><span class="linenos">251</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-252"><a href="#UISRNN.fit_concatenated-252"><span class="linenos">252</span></a>    <span class="n">train_loss</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN.fit_concatenated-253"><a href="#UISRNN.fit_concatenated-253"><span class="linenos">253</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-254"><a href="#UISRNN.fit_concatenated-254"><span class="linenos">254</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">zero_grad</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-255"><a href="#UISRNN.fit_concatenated-255"><span class="linenos">255</span></a>      <span class="c1"># For online learning, pack a subset in each iteration.</span>
+</span><span id="UISRNN.fit_concatenated-256"><a href="#UISRNN.fit_concatenated-256"><span class="linenos">256</span></a>      <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN.fit_concatenated-257"><a href="#UISRNN.fit_concatenated-257"><span class="linenos">257</span></a>        <span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">pack_sequence</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-258"><a href="#UISRNN.fit_concatenated-258"><span class="linenos">258</span></a>            <span class="n">sub_sequences</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-259"><a href="#UISRNN.fit_concatenated-259"><span class="linenos">259</span></a>            <span class="n">seq_lengths</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-260"><a href="#UISRNN.fit_concatenated-260"><span class="linenos">260</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-261"><a href="#UISRNN.fit_concatenated-261"><span class="linenos">261</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-262"><a href="#UISRNN.fit_concatenated-262"><span class="linenos">262</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-263"><a href="#UISRNN.fit_concatenated-263"><span class="linenos">263</span></a>      <span class="n">hidden</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_init_hidden</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-264"><a href="#UISRNN.fit_concatenated-264"><span class="linenos">264</span></a>      <span class="n">mean</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="p">(</span><span class="n">packed_train_sequence</span><span class="p">,</span> <span class="n">hidden</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-265"><a href="#UISRNN.fit_concatenated-265"><span class="linenos">265</span></a>      <span class="c1"># use mean to predict</span>
+</span><span id="UISRNN.fit_concatenated-266"><a href="#UISRNN.fit_concatenated-266"><span class="linenos">266</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-267"><a href="#UISRNN.fit_concatenated-267"><span class="linenos">267</span></a>      <span class="n">mean_size</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">size</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-268"><a href="#UISRNN.fit_concatenated-268"><span class="linenos">268</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mm</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-269"><a href="#UISRNN.fit_concatenated-269"><span class="linenos">269</span></a>          <span class="n">torch</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-270"><a href="#UISRNN.fit_concatenated-270"><span class="linenos">270</span></a>              <span class="mf">1.0</span> <span class="o">/</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)),</span>
+</span><span id="UISRNN.fit_concatenated-271"><a href="#UISRNN.fit_concatenated-271"><span class="linenos">271</span></a>          <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN.fit_concatenated-272"><a href="#UISRNN.fit_concatenated-272"><span class="linenos">272</span></a>      <span class="n">mean</span> <span class="o">=</span> <span class="n">mean</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">mean_size</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-273"><a href="#UISRNN.fit_concatenated-273"><span class="linenos">273</span></a>
+</span><span id="UISRNN.fit_concatenated-274"><a href="#UISRNN.fit_concatenated-274"><span class="linenos">274</span></a>      <span class="c1"># Likelihood part.</span>
+</span><span id="UISRNN.fit_concatenated-275"><a href="#UISRNN.fit_concatenated-275"><span class="linenos">275</span></a>      <span class="n">loss1</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">weighted_mse_loss</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-276"><a href="#UISRNN.fit_concatenated-276"><span class="linenos">276</span></a>          <span class="n">input_tensor</span><span class="o">=</span><span class="p">(</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:],</span>
+</span><span id="UISRNN.fit_concatenated-277"><a href="#UISRNN.fit_concatenated-277"><span class="linenos">277</span></a>          <span class="n">target_tensor</span><span class="o">=</span><span class="n">rnn_truth</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-278"><a href="#UISRNN.fit_concatenated-278"><span class="linenos">278</span></a>          <span class="n">weight</span><span class="o">=</span><span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">))</span>
+</span><span id="UISRNN.fit_concatenated-279"><a href="#UISRNN.fit_concatenated-279"><span class="linenos">279</span></a>
+</span><span id="UISRNN.fit_concatenated-280"><a href="#UISRNN.fit_concatenated-280"><span class="linenos">280</span></a>      <span class="c1"># Sigma2 prior part.</span>
+</span><span id="UISRNN.fit_concatenated-281"><a href="#UISRNN.fit_concatenated-281"><span class="linenos">281</span></a>      <span class="n">weight</span> <span class="o">=</span> <span class="p">(((</span><span class="n">rnn_truth</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">*</span> <span class="n">mean</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:]</span> <span class="o">-</span> <span class="n">rnn_truth</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-282"><a href="#UISRNN.fit_concatenated-282"><span class="linenos">282</span></a>                <span class="o">**</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-283"><a href="#UISRNN.fit_concatenated-283"><span class="linenos">283</span></a>      <span class="n">num_non_zero</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">((</span><span class="n">weight</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-284"><a href="#UISRNN.fit_concatenated-284"><span class="linenos">284</span></a>      <span class="n">loss2</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">sigma2_prior_loss</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-285"><a href="#UISRNN.fit_concatenated-285"><span class="linenos">285</span></a>          <span class="n">num_non_zero</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-286"><a href="#UISRNN.fit_concatenated-286"><span class="linenos">286</span></a>
+</span><span id="UISRNN.fit_concatenated-287"><a href="#UISRNN.fit_concatenated-287"><span class="linenos">287</span></a>      <span class="c1"># Regularization part.</span>
+</span><span id="UISRNN.fit_concatenated-288"><a href="#UISRNN.fit_concatenated-288"><span class="linenos">288</span></a>      <span class="n">loss3</span> <span class="o">=</span> <span class="n">loss_func</span><span class="o">.</span><span class="n">regularization_loss</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-289"><a href="#UISRNN.fit_concatenated-289"><span class="linenos">289</span></a>          <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-290"><a href="#UISRNN.fit_concatenated-290"><span class="linenos">290</span></a>
+</span><span id="UISRNN.fit_concatenated-291"><a href="#UISRNN.fit_concatenated-291"><span class="linenos">291</span></a>      <span class="n">loss</span> <span class="o">=</span> <span class="n">loss1</span> <span class="o">+</span> <span class="n">loss2</span> <span class="o">+</span> <span class="n">loss3</span>
+</span><span id="UISRNN.fit_concatenated-292"><a href="#UISRNN.fit_concatenated-292"><span class="linenos">292</span></a>      <span class="n">loss</span><span class="o">.</span><span class="n">backward</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-293"><a href="#UISRNN.fit_concatenated-293"><span class="linenos">293</span></a>      <span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">clip_grad_norm_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span> <span class="n">args</span><span class="o">.</span><span class="n">grad_max_norm</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-294"><a href="#UISRNN.fit_concatenated-294"><span class="linenos">294</span></a>      <span class="n">optimizer</span><span class="o">.</span><span class="n">step</span><span class="p">()</span>
+</span><span id="UISRNN.fit_concatenated-295"><a href="#UISRNN.fit_concatenated-295"><span class="linenos">295</span></a>      <span class="c1"># avoid numerical issues</span>
+</span><span id="UISRNN.fit_concatenated-296"><a href="#UISRNN.fit_concatenated-296"><span class="linenos">296</span></a>      <span class="bp">self</span><span class="o">.</span><span class="n">sigma2</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">clamp_</span><span class="p">(</span><span class="nb">min</span><span class="o">=</span><span class="mf">1e-6</span><span class="p">)</span>
+</span><span id="UISRNN.fit_concatenated-297"><a href="#UISRNN.fit_concatenated-297"><span class="linenos">297</span></a>
+</span><span id="UISRNN.fit_concatenated-298"><a href="#UISRNN.fit_concatenated-298"><span class="linenos">298</span></a>      <span class="k">if</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">remainder</span><span class="p">(</span><span class="n">num_iter</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span>
+</span><span id="UISRNN.fit_concatenated-299"><a href="#UISRNN.fit_concatenated-299"><span class="linenos">299</span></a>          <span class="n">num_iter</span> <span class="o">==</span> <span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="UISRNN.fit_concatenated-300"><a href="#UISRNN.fit_concatenated-300"><span class="linenos">300</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-301"><a href="#UISRNN.fit_concatenated-301"><span class="linenos">301</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-302"><a href="#UISRNN.fit_concatenated-302"><span class="linenos">302</span></a>            <span class="s1">&#39;Iter: </span><span class="si">{:d}</span><span class="s1">  </span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-303"><a href="#UISRNN.fit_concatenated-303"><span class="linenos">303</span></a>            <span class="s1">&#39;Training Loss: </span><span class="si">{:.4f}</span><span class="s1">    </span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-304"><a href="#UISRNN.fit_concatenated-304"><span class="linenos">304</span></a>            <span class="s1">&#39;    Negative Log Likelihood: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-305"><a href="#UISRNN.fit_concatenated-305"><span class="linenos">305</span></a>            <span class="s1">&#39;Sigma2 Prior: </span><span class="si">{:.4f}</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="UISRNN.fit_concatenated-306"><a href="#UISRNN.fit_concatenated-306"><span class="linenos">306</span></a>            <span class="s1">&#39;Regularization: </span><span class="si">{:.4f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-307"><a href="#UISRNN.fit_concatenated-307"><span class="linenos">307</span></a>                <span class="n">num_iter</span><span class="p">,</span>
+</span><span id="UISRNN.fit_concatenated-308"><a href="#UISRNN.fit_concatenated-308"><span class="linenos">308</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN.fit_concatenated-309"><a href="#UISRNN.fit_concatenated-309"><span class="linenos">309</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN.fit_concatenated-310"><a href="#UISRNN.fit_concatenated-310"><span class="linenos">310</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss2</span><span class="o">.</span><span class="n">data</span><span class="p">),</span>
+</span><span id="UISRNN.fit_concatenated-311"><a href="#UISRNN.fit_concatenated-311"><span class="linenos">311</span></a>                <span class="nb">float</span><span class="p">(</span><span class="n">loss3</span><span class="o">.</span><span class="n">data</span><span class="p">)))</span>
+</span><span id="UISRNN.fit_concatenated-312"><a href="#UISRNN.fit_concatenated-312"><span class="linenos">312</span></a>      <span class="n">train_loss</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">float</span><span class="p">(</span><span class="n">loss1</span><span class="o">.</span><span class="n">data</span><span class="p">))</span>  <span class="c1"># only save the likelihood part</span>
+</span><span id="UISRNN.fit_concatenated-313"><a href="#UISRNN.fit_concatenated-313"><span class="linenos">313</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.fit_concatenated-314"><a href="#UISRNN.fit_concatenated-314"><span class="linenos">314</span></a>        <span class="mi">1</span><span class="p">,</span> <span class="s1">&#39;Done training with </span><span class="si">{}</span><span class="s1"> iterations&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">train_iteration</span><span class="p">))</span>
 </span></pre></div>
 
 
@@ -2001,22 +2003,25 @@ <h5>Inherited Members</h5>
  [0.8 -1.1 0.4 0.5]    --&gt; an entry of speaker #1 from utterance 'iaaa'
  [-0.2 1.0 3.8 5.7]    --&gt; an entry of speaker #0 from utterance 'iaaa'
  [3.8 -0.1 1.5 2.3]    --&gt; an entry of speaker #0 from utterance 'ibbb'
- [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'</p>
+ [1.2 1.4 3.6 -2.7]]   --&gt; an entry of speaker #0 from utterance 'ibbb'
+</code></pre></p>
 
+<pre><code>Here `N=5`, `D=4`.
+
+We concatenate all training utterances into this single sequence.
 </code></pre>
-    Here `N=5`, `D=4`.
-<pre><code>We concatenate all training utterances into this single sequence.
 
-<p></code></pre>
-  train_cluster_id: the speaker id sequence, which is 1-dim list or
+<p>train_cluster_id: the speaker id sequence, which is 1-dim list or
     numpy array of strings, of size <code>N</code>.
-    For example,
-  <pre><code>train_cluster_id =
+    For example,</p>
+
+<p><pre><code>train_cluster_id =
   ['iaaa_0', 'iaaa_1', 'iaaa_0', 'ibbb_0', 'ibbb_0']
-</code></pre>
-    'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.</p>
+</code></pre></p>
+
+<pre><code>'iaaa_0' means the entry belongs to speaker #0 in utterance 'iaaa'.
 
-<pre><code>Note that the order of entries within an utterance are preserved,
+Note that the order of entries within an utterance are preserved,
 and all utterances are simply concatenated together.
 </code></pre>
 
@@ -2040,78 +2045,78 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN.fit"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit-315"><a href="#UISRNN.fit-315"><span class="linenos">315</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.fit-316"><a href="#UISRNN.fit-316"><span class="linenos">316</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
-</span><span id="UISRNN.fit-317"><a href="#UISRNN.fit-317"><span class="linenos">317</span></a>
-</span><span id="UISRNN.fit-318"><a href="#UISRNN.fit-318"><span class="linenos">318</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.fit-319"><a href="#UISRNN.fit-319"><span class="linenos">319</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
-</span><span id="UISRNN.fit-320"><a href="#UISRNN.fit-320"><span class="linenos">320</span></a><span class="sd">        concatenated training sequence:</span>
-</span><span id="UISRNN.fit-321"><a href="#UISRNN.fit-321"><span class="linenos">321</span></a>
-</span><span id="UISRNN.fit-322"><a href="#UISRNN.fit-322"><span class="linenos">322</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
-</span><span id="UISRNN.fit-323"><a href="#UISRNN.fit-323"><span class="linenos">323</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
-</span><span id="UISRNN.fit-324"><a href="#UISRNN.fit-324"><span class="linenos">324</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
-</span><span id="UISRNN.fit-325"><a href="#UISRNN.fit-325"><span class="linenos">325</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
-</span><span id="UISRNN.fit-326"><a href="#UISRNN.fit-326"><span class="linenos">326</span></a><span class="sd">           embeddings of one utterance.</span>
-</span><span id="UISRNN.fit-327"><a href="#UISRNN.fit-327"><span class="linenos">327</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
-</span><span id="UISRNN.fit-328"><a href="#UISRNN.fit-328"><span class="linenos">328</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
-</span><span id="UISRNN.fit-329"><a href="#UISRNN.fit-329"><span class="linenos">329</span></a><span class="sd">           for more details.</span>
-</span><span id="UISRNN.fit-330"><a href="#UISRNN.fit-330"><span class="linenos">330</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
-</span><span id="UISRNN.fit-331"><a href="#UISRNN.fit-331"><span class="linenos">331</span></a>
-</span><span id="UISRNN.fit-332"><a href="#UISRNN.fit-332"><span class="linenos">332</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
-</span><span id="UISRNN.fit-333"><a href="#UISRNN.fit-333"><span class="linenos">333</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
-</span><span id="UISRNN.fit-334"><a href="#UISRNN.fit-334"><span class="linenos">334</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
-</span><span id="UISRNN.fit-335"><a href="#UISRNN.fit-335"><span class="linenos">335</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
-</span><span id="UISRNN.fit-336"><a href="#UISRNN.fit-336"><span class="linenos">336</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.fit-337"><a href="#UISRNN.fit-337"><span class="linenos">337</span></a>
-</span><span id="UISRNN.fit-338"><a href="#UISRNN.fit-338"><span class="linenos">338</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.fit-339"><a href="#UISRNN.fit-339"><span class="linenos">339</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
-</span><span id="UISRNN.fit-340"><a href="#UISRNN.fit-340"><span class="linenos">340</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.fit-341"><a href="#UISRNN.fit-341"><span class="linenos">341</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN.fit-342"><a href="#UISRNN.fit-342"><span class="linenos">342</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
-</span><span id="UISRNN.fit-343"><a href="#UISRNN.fit-343"><span class="linenos">343</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN.fit-344"><a href="#UISRNN.fit-344"><span class="linenos">344</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
-</span><span id="UISRNN.fit-345"><a href="#UISRNN.fit-345"><span class="linenos">345</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
-</span><span id="UISRNN.fit-346"><a href="#UISRNN.fit-346"><span class="linenos">346</span></a>            <span class="mi">2</span><span class="p">,</span>
-</span><span id="UISRNN.fit-347"><a href="#UISRNN.fit-347"><span class="linenos">347</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
-</span><span id="UISRNN.fit-348"><a href="#UISRNN.fit-348"><span class="linenos">348</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
-</span><span id="UISRNN.fit-349"><a href="#UISRNN.fit-349"><span class="linenos">349</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
-</span><span id="UISRNN.fit-350"><a href="#UISRNN.fit-350"><span class="linenos">350</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
-</span><span id="UISRNN.fit-351"><a href="#UISRNN.fit-351"><span class="linenos">351</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit-352"><a href="#UISRNN.fit-352"><span class="linenos">352</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
-</span><span id="UISRNN.fit-353"><a href="#UISRNN.fit-353"><span class="linenos">353</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
-</span><span id="UISRNN.fit-354"><a href="#UISRNN.fit-354"><span class="linenos">354</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN.fit-355"><a href="#UISRNN.fit-355"><span class="linenos">355</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
-</span><span id="UISRNN.fit-356"><a href="#UISRNN.fit-356"><span class="linenos">356</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
-</span><span id="UISRNN.fit-357"><a href="#UISRNN.fit-357"><span class="linenos">357</span></a>      <span class="k">pass</span>
-</span><span id="UISRNN.fit-358"><a href="#UISRNN.fit-358"><span class="linenos">358</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN.fit-359"><a href="#UISRNN.fit-359"><span class="linenos">359</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.fit-360"><a href="#UISRNN.fit-360"><span class="linenos">360</span></a>
-</span><span id="UISRNN.fit-361"><a href="#UISRNN.fit-361"><span class="linenos">361</span></a>    <span class="c1"># estimate transition_bias</span>
-</span><span id="UISRNN.fit-362"><a href="#UISRNN.fit-362"><span class="linenos">362</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
-</span><span id="UISRNN.fit-363"><a href="#UISRNN.fit-363"><span class="linenos">363</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
-</span><span id="UISRNN.fit-364"><a href="#UISRNN.fit-364"><span class="linenos">364</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
-</span><span id="UISRNN.fit-365"><a href="#UISRNN.fit-365"><span class="linenos">365</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
-</span><span id="UISRNN.fit-366"><a href="#UISRNN.fit-366"><span class="linenos">366</span></a>      <span class="c1"># set or update transition_bias</span>
-</span><span id="UISRNN.fit-367"><a href="#UISRNN.fit-367"><span class="linenos">367</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="UISRNN.fit-368"><a href="#UISRNN.fit-368"><span class="linenos">368</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
-</span><span id="UISRNN.fit-369"><a href="#UISRNN.fit-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN.fit-370"><a href="#UISRNN.fit-370"><span class="linenos">370</span></a>      <span class="k">else</span><span class="p">:</span>
-</span><span id="UISRNN.fit-371"><a href="#UISRNN.fit-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="UISRNN.fit-372"><a href="#UISRNN.fit-372"><span class="linenos">372</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
-</span><span id="UISRNN.fit-373"><a href="#UISRNN.fit-373"><span class="linenos">373</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
-</span><span id="UISRNN.fit-374"><a href="#UISRNN.fit-374"><span class="linenos">374</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
-</span><span id="UISRNN.fit-375"><a href="#UISRNN.fit-375"><span class="linenos">375</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
-</span><span id="UISRNN.fit-376"><a href="#UISRNN.fit-376"><span class="linenos">376</span></a>
-</span><span id="UISRNN.fit-377"><a href="#UISRNN.fit-377"><span class="linenos">377</span></a>    <span class="c1"># concatenate train_sequences</span>
-</span><span id="UISRNN.fit-378"><a href="#UISRNN.fit-378"><span class="linenos">378</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
-</span><span id="UISRNN.fit-379"><a href="#UISRNN.fit-379"><span class="linenos">379</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
-</span><span id="UISRNN.fit-380"><a href="#UISRNN.fit-380"><span class="linenos">380</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
-</span><span id="UISRNN.fit-381"><a href="#UISRNN.fit-381"><span class="linenos">381</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
-</span><span id="UISRNN.fit-382"><a href="#UISRNN.fit-382"><span class="linenos">382</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
-</span><span id="UISRNN.fit-383"><a href="#UISRNN.fit-383"><span class="linenos">383</span></a>         <span class="kc">True</span><span class="p">)</span>
-</span><span id="UISRNN.fit-384"><a href="#UISRNN.fit-384"><span class="linenos">384</span></a>
-</span><span id="UISRNN.fit-385"><a href="#UISRNN.fit-385"><span class="linenos">385</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
-</span><span id="UISRNN.fit-386"><a href="#UISRNN.fit-386"><span class="linenos">386</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.fit-316"><a href="#UISRNN.fit-316"><span class="linenos">316</span></a>  <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.fit-317"><a href="#UISRNN.fit-317"><span class="linenos">317</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Fit UISRNN model.</span>
+</span><span id="UISRNN.fit-318"><a href="#UISRNN.fit-318"><span class="linenos">318</span></a>
+</span><span id="UISRNN.fit-319"><a href="#UISRNN.fit-319"><span class="linenos">319</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.fit-320"><a href="#UISRNN.fit-320"><span class="linenos">320</span></a><span class="sd">      train_sequences: Either a list of training sequences, or a single</span>
+</span><span id="UISRNN.fit-321"><a href="#UISRNN.fit-321"><span class="linenos">321</span></a><span class="sd">        concatenated training sequence:</span>
+</span><span id="UISRNN.fit-322"><a href="#UISRNN.fit-322"><span class="linenos">322</span></a>
+</span><span id="UISRNN.fit-323"><a href="#UISRNN.fit-323"><span class="linenos">323</span></a><span class="sd">        1. train_sequences is list, and each element is a 2-dim numpy array</span>
+</span><span id="UISRNN.fit-324"><a href="#UISRNN.fit-324"><span class="linenos">324</span></a><span class="sd">           of real numbers, of size: `length * D`.</span>
+</span><span id="UISRNN.fit-325"><a href="#UISRNN.fit-325"><span class="linenos">325</span></a><span class="sd">           The length varies among different sequences, but the D is the same.</span>
+</span><span id="UISRNN.fit-326"><a href="#UISRNN.fit-326"><span class="linenos">326</span></a><span class="sd">           In speaker diarization, each sequence is the sequence of speaker</span>
+</span><span id="UISRNN.fit-327"><a href="#UISRNN.fit-327"><span class="linenos">327</span></a><span class="sd">           embeddings of one utterance.</span>
+</span><span id="UISRNN.fit-328"><a href="#UISRNN.fit-328"><span class="linenos">328</span></a><span class="sd">        2. train_sequences is a single concatenated sequence, which is a</span>
+</span><span id="UISRNN.fit-329"><a href="#UISRNN.fit-329"><span class="linenos">329</span></a><span class="sd">           2-dim numpy array of real numbers. See `fit_concatenated()`</span>
+</span><span id="UISRNN.fit-330"><a href="#UISRNN.fit-330"><span class="linenos">330</span></a><span class="sd">           for more details.</span>
+</span><span id="UISRNN.fit-331"><a href="#UISRNN.fit-331"><span class="linenos">331</span></a><span class="sd">      train_cluster_ids: Ground truth labels for train_sequences:</span>
+</span><span id="UISRNN.fit-332"><a href="#UISRNN.fit-332"><span class="linenos">332</span></a>
+</span><span id="UISRNN.fit-333"><a href="#UISRNN.fit-333"><span class="linenos">333</span></a><span class="sd">        1. if train_sequences is a list, this must also be a list of the same</span>
+</span><span id="UISRNN.fit-334"><a href="#UISRNN.fit-334"><span class="linenos">334</span></a><span class="sd">           size, each element being a 1-dim list or numpy array of strings.</span>
+</span><span id="UISRNN.fit-335"><a href="#UISRNN.fit-335"><span class="linenos">335</span></a><span class="sd">        2. if train_sequences is a single concatenated sequence, this</span>
+</span><span id="UISRNN.fit-336"><a href="#UISRNN.fit-336"><span class="linenos">336</span></a><span class="sd">           must also be the concatenated 1-dim list or numpy array of strings</span>
+</span><span id="UISRNN.fit-337"><a href="#UISRNN.fit-337"><span class="linenos">337</span></a><span class="sd">      args: Training configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.fit-338"><a href="#UISRNN.fit-338"><span class="linenos">338</span></a>
+</span><span id="UISRNN.fit-339"><a href="#UISRNN.fit-339"><span class="linenos">339</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.fit-340"><a href="#UISRNN.fit-340"><span class="linenos">340</span></a><span class="sd">      TypeError: If train_sequences or train_cluster_ids is of wrong type.</span>
+</span><span id="UISRNN.fit-341"><a href="#UISRNN.fit-341"><span class="linenos">341</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.fit-342"><a href="#UISRNN.fit-342"><span class="linenos">342</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN.fit-343"><a href="#UISRNN.fit-343"><span class="linenos">343</span></a>      <span class="c1"># train_sequences is already the concatenated sequence</span>
+</span><span id="UISRNN.fit-344"><a href="#UISRNN.fit-344"><span class="linenos">344</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN.fit-345"><a href="#UISRNN.fit-345"><span class="linenos">345</span></a>        <span class="c1"># see issue #55: https://github.com/google/uis-rnn/issues/55</span>
+</span><span id="UISRNN.fit-346"><a href="#UISRNN.fit-346"><span class="linenos">346</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">print</span><span class="p">(</span>
+</span><span id="UISRNN.fit-347"><a href="#UISRNN.fit-347"><span class="linenos">347</span></a>            <span class="mi">2</span><span class="p">,</span>
+</span><span id="UISRNN.fit-348"><a href="#UISRNN.fit-348"><span class="linenos">348</span></a>            <span class="s1">&#39;Warning: transition_bias cannot be correctly estimated from a &#39;</span>
+</span><span id="UISRNN.fit-349"><a href="#UISRNN.fit-349"><span class="linenos">349</span></a>            <span class="s1">&#39;concatenated sequence; train_sequences will be treated as a &#39;</span>
+</span><span id="UISRNN.fit-350"><a href="#UISRNN.fit-350"><span class="linenos">350</span></a>            <span class="s1">&#39;single sequence. This can lead to inaccurate estimation of &#39;</span>
+</span><span id="UISRNN.fit-351"><a href="#UISRNN.fit-351"><span class="linenos">351</span></a>            <span class="s1">&#39;transition_bias. Please, consider estimating transition_bias &#39;</span>
+</span><span id="UISRNN.fit-352"><a href="#UISRNN.fit-352"><span class="linenos">352</span></a>            <span class="s1">&#39;before concatenating the sequences and passing it as argument.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit-353"><a href="#UISRNN.fit-353"><span class="linenos">353</span></a>      <span class="n">train_sequences</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_sequences</span><span class="p">]</span>
+</span><span id="UISRNN.fit-354"><a href="#UISRNN.fit-354"><span class="linenos">354</span></a>      <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span><span class="n">train_cluster_ids</span><span class="p">]</span>
+</span><span id="UISRNN.fit-355"><a href="#UISRNN.fit-355"><span class="linenos">355</span></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN.fit-356"><a href="#UISRNN.fit-356"><span class="linenos">356</span></a>      <span class="c1"># train_sequences is a list of un-concatenated sequences</span>
+</span><span id="UISRNN.fit-357"><a href="#UISRNN.fit-357"><span class="linenos">357</span></a>      <span class="c1"># we will concatenate it later, after estimating transition_bias</span>
+</span><span id="UISRNN.fit-358"><a href="#UISRNN.fit-358"><span class="linenos">358</span></a>      <span class="k">pass</span>
+</span><span id="UISRNN.fit-359"><a href="#UISRNN.fit-359"><span class="linenos">359</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN.fit-360"><a href="#UISRNN.fit-360"><span class="linenos">360</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences must be a list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.fit-361"><a href="#UISRNN.fit-361"><span class="linenos">361</span></a>
+</span><span id="UISRNN.fit-362"><a href="#UISRNN.fit-362"><span class="linenos">362</span></a>    <span class="c1"># estimate transition_bias</span>
+</span><span id="UISRNN.fit-363"><a href="#UISRNN.fit-363"><span class="linenos">363</span></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">:</span>
+</span><span id="UISRNN.fit-364"><a href="#UISRNN.fit-364"><span class="linenos">364</span></a>      <span class="p">(</span><span class="n">transition_bias</span><span class="p">,</span>
+</span><span id="UISRNN.fit-365"><a href="#UISRNN.fit-365"><span class="linenos">365</span></a>       <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">estimate_transition_bias</span><span class="p">(</span>
+</span><span id="UISRNN.fit-366"><a href="#UISRNN.fit-366"><span class="linenos">366</span></a>           <span class="n">train_cluster_ids</span><span class="p">)</span>
+</span><span id="UISRNN.fit-367"><a href="#UISRNN.fit-367"><span class="linenos">367</span></a>      <span class="c1"># set or update transition_bias</span>
+</span><span id="UISRNN.fit-368"><a href="#UISRNN.fit-368"><span class="linenos">368</span></a>      <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="UISRNN.fit-369"><a href="#UISRNN.fit-369"><span class="linenos">369</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="n">transition_bias</span>
+</span><span id="UISRNN.fit-370"><a href="#UISRNN.fit-370"><span class="linenos">370</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN.fit-371"><a href="#UISRNN.fit-371"><span class="linenos">371</span></a>      <span class="k">else</span><span class="p">:</span>
+</span><span id="UISRNN.fit-372"><a href="#UISRNN.fit-372"><span class="linenos">372</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="UISRNN.fit-373"><a href="#UISRNN.fit-373"><span class="linenos">373</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span>
+</span><span id="UISRNN.fit-374"><a href="#UISRNN.fit-374"><span class="linenos">374</span></a>            <span class="n">transition_bias</span> <span class="o">*</span> <span class="n">transition_bias_denominator</span><span class="p">)</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="UISRNN.fit-375"><a href="#UISRNN.fit-375"><span class="linenos">375</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+</span> <span class="n">transition_bias_denominator</span><span class="p">)</span>
+</span><span id="UISRNN.fit-376"><a href="#UISRNN.fit-376"><span class="linenos">376</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">transition_bias_denominator</span> <span class="o">+=</span> <span class="n">transition_bias_denominator</span>
+</span><span id="UISRNN.fit-377"><a href="#UISRNN.fit-377"><span class="linenos">377</span></a>
+</span><span id="UISRNN.fit-378"><a href="#UISRNN.fit-378"><span class="linenos">378</span></a>    <span class="c1"># concatenate train_sequences</span>
+</span><span id="UISRNN.fit-379"><a href="#UISRNN.fit-379"><span class="linenos">379</span></a>    <span class="p">(</span><span class="n">concatenated_train_sequence</span><span class="p">,</span>
+</span><span id="UISRNN.fit-380"><a href="#UISRNN.fit-380"><span class="linenos">380</span></a>     <span class="n">concatenated_train_cluster_id</span><span class="p">)</span> <span class="o">=</span> <span class="n">utils</span><span class="o">.</span><span class="n">concatenate_training_data</span><span class="p">(</span>
+</span><span id="UISRNN.fit-381"><a href="#UISRNN.fit-381"><span class="linenos">381</span></a>         <span class="n">train_sequences</span><span class="p">,</span>
+</span><span id="UISRNN.fit-382"><a href="#UISRNN.fit-382"><span class="linenos">382</span></a>         <span class="n">train_cluster_ids</span><span class="p">,</span>
+</span><span id="UISRNN.fit-383"><a href="#UISRNN.fit-383"><span class="linenos">383</span></a>         <span class="n">args</span><span class="o">.</span><span class="n">enforce_cluster_id_uniqueness</span><span class="p">,</span>
+</span><span id="UISRNN.fit-384"><a href="#UISRNN.fit-384"><span class="linenos">384</span></a>         <span class="kc">True</span><span class="p">)</span>
+</span><span id="UISRNN.fit-385"><a href="#UISRNN.fit-385"><span class="linenos">385</span></a>
+</span><span id="UISRNN.fit-386"><a href="#UISRNN.fit-386"><span class="linenos">386</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">fit_concatenated</span><span class="p">(</span>
+</span><span id="UISRNN.fit-387"><a href="#UISRNN.fit-387"><span class="linenos">387</span></a>        <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -2158,90 +2163,90 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN.predict_single"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict_single-479"><a href="#UISRNN.predict_single-479"><span class="linenos">479</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-480"><a href="#UISRNN.predict_single-480"><span class="linenos">480</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
-</span><span id="UISRNN.predict_single-481"><a href="#UISRNN.predict_single-481"><span class="linenos">481</span></a>
-</span><span id="UISRNN.predict_single-482"><a href="#UISRNN.predict_single-482"><span class="linenos">482</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.predict_single-483"><a href="#UISRNN.predict_single-483"><span class="linenos">483</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
-</span><span id="UISRNN.predict_single-484"><a href="#UISRNN.predict_single-484"><span class="linenos">484</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
-</span><span id="UISRNN.predict_single-485"><a href="#UISRNN.predict_single-485"><span class="linenos">485</span></a>
-</span><span id="UISRNN.predict_single-486"><a href="#UISRNN.predict_single-486"><span class="linenos">486</span></a><span class="sd">        - `N`: length of one test utterance.</span>
-</span><span id="UISRNN.predict_single-487"><a href="#UISRNN.predict_single-487"><span class="linenos">487</span></a><span class="sd">        - `D` : observation dimension.</span>
-</span><span id="UISRNN.predict_single-488"><a href="#UISRNN.predict_single-488"><span class="linenos">488</span></a>
-</span><span id="UISRNN.predict_single-489"><a href="#UISRNN.predict_single-489"><span class="linenos">489</span></a><span class="sd">        For example:</span>
-</span><span id="UISRNN.predict_single-490"><a href="#UISRNN.predict_single-490"><span class="linenos">490</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.predict_single-491"><a href="#UISRNN.predict_single-491"><span class="linenos">491</span></a><span class="sd">      test_sequence =</span>
-</span><span id="UISRNN.predict_single-492"><a href="#UISRNN.predict_single-492"><span class="linenos">492</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-493"><a href="#UISRNN.predict_single-493"><span class="linenos">493</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-494"><a href="#UISRNN.predict_single-494"><span class="linenos">494</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-495"><a href="#UISRNN.predict_single-495"><span class="linenos">495</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-496"><a href="#UISRNN.predict_single-496"><span class="linenos">496</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
-</span><span id="UISRNN.predict_single-497"><a href="#UISRNN.predict_single-497"><span class="linenos">497</span></a><span class="sd">      ```</span>
-</span><span id="UISRNN.predict_single-498"><a href="#UISRNN.predict_single-498"><span class="linenos">498</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
-</span><span id="UISRNN.predict_single-499"><a href="#UISRNN.predict_single-499"><span class="linenos">499</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.predict_single-500"><a href="#UISRNN.predict_single-500"><span class="linenos">500</span></a>
-</span><span id="UISRNN.predict_single-501"><a href="#UISRNN.predict_single-501"><span class="linenos">501</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN.predict_single-502"><a href="#UISRNN.predict_single-502"><span class="linenos">502</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
-</span><span id="UISRNN.predict_single-503"><a href="#UISRNN.predict_single-503"><span class="linenos">503</span></a><span class="sd">        an array of integers, of size `N`.</span>
-</span><span id="UISRNN.predict_single-504"><a href="#UISRNN.predict_single-504"><span class="linenos">504</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
-</span><span id="UISRNN.predict_single-505"><a href="#UISRNN.predict_single-505"><span class="linenos">505</span></a>
-</span><span id="UISRNN.predict_single-506"><a href="#UISRNN.predict_single-506"><span class="linenos">506</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.predict_single-507"><a href="#UISRNN.predict_single-507"><span class="linenos">507</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
-</span><span id="UISRNN.predict_single-508"><a href="#UISRNN.predict_single-508"><span class="linenos">508</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
-</span><span id="UISRNN.predict_single-509"><a href="#UISRNN.predict_single-509"><span class="linenos">509</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.predict_single-510"><a href="#UISRNN.predict_single-510"><span class="linenos">510</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN.predict_single-511"><a href="#UISRNN.predict_single-511"><span class="linenos">511</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
-</span><span id="UISRNN.predict_single-512"><a href="#UISRNN.predict_single-512"><span class="linenos">512</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-513"><a href="#UISRNN.predict_single-513"><span class="linenos">513</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-514"><a href="#UISRNN.predict_single-514"><span class="linenos">514</span></a>    <span class="c1"># check dimension</span>
-</span><span id="UISRNN.predict_single-515"><a href="#UISRNN.predict_single-515"><span class="linenos">515</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="UISRNN.predict_single-516"><a href="#UISRNN.predict_single-516"><span class="linenos">516</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-517"><a href="#UISRNN.predict_single-517"><span class="linenos">517</span></a>    <span class="c1"># check size</span>
-</span><span id="UISRNN.predict_single-518"><a href="#UISRNN.predict_single-518"><span class="linenos">518</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="UISRNN.predict_single-519"><a href="#UISRNN.predict_single-519"><span class="linenos">519</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="UISRNN.predict_single-520"><a href="#UISRNN.predict_single-520"><span class="linenos">520</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
-</span><span id="UISRNN.predict_single-521"><a href="#UISRNN.predict_single-521"><span class="linenos">521</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-522"><a href="#UISRNN.predict_single-522"><span class="linenos">522</span></a>
-</span><span id="UISRNN.predict_single-523"><a href="#UISRNN.predict_single-523"><span class="linenos">523</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
-</span><span id="UISRNN.predict_single-524"><a href="#UISRNN.predict_single-524"><span class="linenos">524</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
-</span><span id="UISRNN.predict_single-525"><a href="#UISRNN.predict_single-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-526"><a href="#UISRNN.predict_single-526"><span class="linenos">526</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-527"><a href="#UISRNN.predict_single-527"><span class="linenos">527</span></a>    <span class="c1"># bookkeeping for beam search</span>
-</span><span id="UISRNN.predict_single-528"><a href="#UISRNN.predict_single-528"><span class="linenos">528</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
-</span><span id="UISRNN.predict_single-529"><a href="#UISRNN.predict_single-529"><span class="linenos">529</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
-</span><span id="UISRNN.predict_single-530"><a href="#UISRNN.predict_single-530"><span class="linenos">530</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-531"><a href="#UISRNN.predict_single-531"><span class="linenos">531</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
-</span><span id="UISRNN.predict_single-532"><a href="#UISRNN.predict_single-532"><span class="linenos">532</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
-</span><span id="UISRNN.predict_single-533"><a href="#UISRNN.predict_single-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="UISRNN.predict_single-534"><a href="#UISRNN.predict_single-534"><span class="linenos">534</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-535"><a href="#UISRNN.predict_single-535"><span class="linenos">535</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-536"><a href="#UISRNN.predict_single-536"><span class="linenos">536</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-537"><a href="#UISRNN.predict_single-537"><span class="linenos">537</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
-</span><span id="UISRNN.predict_single-538"><a href="#UISRNN.predict_single-538"><span class="linenos">538</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
-</span><span id="UISRNN.predict_single-539"><a href="#UISRNN.predict_single-539"><span class="linenos">539</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-540"><a href="#UISRNN.predict_single-540"><span class="linenos">540</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-541"><a href="#UISRNN.predict_single-541"><span class="linenos">541</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
-</span><span id="UISRNN.predict_single-542"><a href="#UISRNN.predict_single-542"><span class="linenos">542</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
-</span><span id="UISRNN.predict_single-543"><a href="#UISRNN.predict_single-543"><span class="linenos">543</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
-</span><span id="UISRNN.predict_single-544"><a href="#UISRNN.predict_single-544"><span class="linenos">544</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
-</span><span id="UISRNN.predict_single-545"><a href="#UISRNN.predict_single-545"><span class="linenos">545</span></a>      <span class="c1"># find top scores</span>
-</span><span id="UISRNN.predict_single-546"><a href="#UISRNN.predict_single-546"><span class="linenos">546</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-547"><a href="#UISRNN.predict_single-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="UISRNN.predict_single-548"><a href="#UISRNN.predict_single-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-549"><a href="#UISRNN.predict_single-549"><span class="linenos">549</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-550"><a href="#UISRNN.predict_single-550"><span class="linenos">550</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="UISRNN.predict_single-551"><a href="#UISRNN.predict_single-551"><span class="linenos">551</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-552"><a href="#UISRNN.predict_single-552"><span class="linenos">552</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
-</span><span id="UISRNN.predict_single-553"><a href="#UISRNN.predict_single-553"><span class="linenos">553</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
-</span><span id="UISRNN.predict_single-554"><a href="#UISRNN.predict_single-554"><span class="linenos">554</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-555"><a href="#UISRNN.predict_single-555"><span class="linenos">555</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
-</span><span id="UISRNN.predict_single-556"><a href="#UISRNN.predict_single-556"><span class="linenos">556</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
-</span><span id="UISRNN.predict_single-557"><a href="#UISRNN.predict_single-557"><span class="linenos">557</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
-</span><span id="UISRNN.predict_single-558"><a href="#UISRNN.predict_single-558"><span class="linenos">558</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-559"><a href="#UISRNN.predict_single-559"><span class="linenos">559</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
-</span><span id="UISRNN.predict_single-560"><a href="#UISRNN.predict_single-560"><span class="linenos">560</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
-</span><span id="UISRNN.predict_single-561"><a href="#UISRNN.predict_single-561"><span class="linenos">561</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
-</span><span id="UISRNN.predict_single-562"><a href="#UISRNN.predict_single-562"><span class="linenos">562</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict_single-480"><a href="#UISRNN.predict_single-480"><span class="linenos">480</span></a>  <span class="k">def</span> <span class="nf">predict_single</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-481"><a href="#UISRNN.predict_single-481"><span class="linenos">481</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single test sequence using UISRNN model.</span>
+</span><span id="UISRNN.predict_single-482"><a href="#UISRNN.predict_single-482"><span class="linenos">482</span></a>
+</span><span id="UISRNN.predict_single-483"><a href="#UISRNN.predict_single-483"><span class="linenos">483</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.predict_single-484"><a href="#UISRNN.predict_single-484"><span class="linenos">484</span></a><span class="sd">      test_sequence: the test observation sequence, which is 2-dim numpy array</span>
+</span><span id="UISRNN.predict_single-485"><a href="#UISRNN.predict_single-485"><span class="linenos">485</span></a><span class="sd">        of real numbers, of size `N * D`.</span>
+</span><span id="UISRNN.predict_single-486"><a href="#UISRNN.predict_single-486"><span class="linenos">486</span></a>
+</span><span id="UISRNN.predict_single-487"><a href="#UISRNN.predict_single-487"><span class="linenos">487</span></a><span class="sd">        - `N`: length of one test utterance.</span>
+</span><span id="UISRNN.predict_single-488"><a href="#UISRNN.predict_single-488"><span class="linenos">488</span></a><span class="sd">        - `D` : observation dimension.</span>
+</span><span id="UISRNN.predict_single-489"><a href="#UISRNN.predict_single-489"><span class="linenos">489</span></a>
+</span><span id="UISRNN.predict_single-490"><a href="#UISRNN.predict_single-490"><span class="linenos">490</span></a><span class="sd">        For example:</span>
+</span><span id="UISRNN.predict_single-491"><a href="#UISRNN.predict_single-491"><span class="linenos">491</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.predict_single-492"><a href="#UISRNN.predict_single-492"><span class="linenos">492</span></a><span class="sd">      test_sequence =</span>
+</span><span id="UISRNN.predict_single-493"><a href="#UISRNN.predict_single-493"><span class="linenos">493</span></a><span class="sd">      [[2.2 -1.0 3.0 5.6]    --&gt; 1st entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-494"><a href="#UISRNN.predict_single-494"><span class="linenos">494</span></a><span class="sd">       [0.5 1.8 -3.2 0.4]    --&gt; 2nd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-495"><a href="#UISRNN.predict_single-495"><span class="linenos">495</span></a><span class="sd">       [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-496"><a href="#UISRNN.predict_single-496"><span class="linenos">496</span></a><span class="sd">       [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-497"><a href="#UISRNN.predict_single-497"><span class="linenos">497</span></a><span class="sd">       [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance &#39;iccc&#39;</span>
+</span><span id="UISRNN.predict_single-498"><a href="#UISRNN.predict_single-498"><span class="linenos">498</span></a><span class="sd">      ```</span>
+</span><span id="UISRNN.predict_single-499"><a href="#UISRNN.predict_single-499"><span class="linenos">499</span></a><span class="sd">        Here `N=5`, `D=4`.</span>
+</span><span id="UISRNN.predict_single-500"><a href="#UISRNN.predict_single-500"><span class="linenos">500</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.predict_single-501"><a href="#UISRNN.predict_single-501"><span class="linenos">501</span></a>
+</span><span id="UISRNN.predict_single-502"><a href="#UISRNN.predict_single-502"><span class="linenos">502</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN.predict_single-503"><a href="#UISRNN.predict_single-503"><span class="linenos">503</span></a><span class="sd">      predicted_cluster_id: predicted speaker id sequence, which is</span>
+</span><span id="UISRNN.predict_single-504"><a href="#UISRNN.predict_single-504"><span class="linenos">504</span></a><span class="sd">        an array of integers, of size `N`.</span>
+</span><span id="UISRNN.predict_single-505"><a href="#UISRNN.predict_single-505"><span class="linenos">505</span></a><span class="sd">        For example, `predicted_cluster_id = [0, 1, 0, 0, 1]`</span>
+</span><span id="UISRNN.predict_single-506"><a href="#UISRNN.predict_single-506"><span class="linenos">506</span></a>
+</span><span id="UISRNN.predict_single-507"><a href="#UISRNN.predict_single-507"><span class="linenos">507</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.predict_single-508"><a href="#UISRNN.predict_single-508"><span class="linenos">508</span></a><span class="sd">      TypeError: If test_sequence is of wrong type.</span>
+</span><span id="UISRNN.predict_single-509"><a href="#UISRNN.predict_single-509"><span class="linenos">509</span></a><span class="sd">      ValueError: If test_sequence has wrong dimension.</span>
+</span><span id="UISRNN.predict_single-510"><a href="#UISRNN.predict_single-510"><span class="linenos">510</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.predict_single-511"><a href="#UISRNN.predict_single-511"><span class="linenos">511</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN.predict_single-512"><a href="#UISRNN.predict_single-512"><span class="linenos">512</span></a>    <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="ow">or</span>
+</span><span id="UISRNN.predict_single-513"><a href="#UISRNN.predict_single-513"><span class="linenos">513</span></a>        <span class="n">test_sequence</span><span class="o">.</span><span class="n">dtype</span> <span class="o">!=</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-514"><a href="#UISRNN.predict_single-514"><span class="linenos">514</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequence should be a numpy array of float type.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-515"><a href="#UISRNN.predict_single-515"><span class="linenos">515</span></a>    <span class="c1"># check dimension</span>
+</span><span id="UISRNN.predict_single-516"><a href="#UISRNN.predict_single-516"><span class="linenos">516</span></a>    <span class="k">if</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">ndim</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="UISRNN.predict_single-517"><a href="#UISRNN.predict_single-517"><span class="linenos">517</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence must be 2-dim array.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-518"><a href="#UISRNN.predict_single-518"><span class="linenos">518</span></a>    <span class="c1"># check size</span>
+</span><span id="UISRNN.predict_single-519"><a href="#UISRNN.predict_single-519"><span class="linenos">519</span></a>    <span class="n">test_sequence_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="UISRNN.predict_single-520"><a href="#UISRNN.predict_single-520"><span class="linenos">520</span></a>    <span class="k">if</span> <span class="n">observation_dim</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="UISRNN.predict_single-521"><a href="#UISRNN.predict_single-521"><span class="linenos">521</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;test_sequence does not match the dimension specified &#39;</span>
+</span><span id="UISRNN.predict_single-522"><a href="#UISRNN.predict_single-522"><span class="linenos">522</span></a>                       <span class="s1">&#39;by args.observation_dim.&#39;</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-523"><a href="#UISRNN.predict_single-523"><span class="linenos">523</span></a>
+</span><span id="UISRNN.predict_single-524"><a href="#UISRNN.predict_single-524"><span class="linenos">524</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">eval</span><span class="p">()</span>
+</span><span id="UISRNN.predict_single-525"><a href="#UISRNN.predict_single-525"><span class="linenos">525</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
+</span><span id="UISRNN.predict_single-526"><a href="#UISRNN.predict_single-526"><span class="linenos">526</span></a>    <span class="n">test_sequence</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-527"><a href="#UISRNN.predict_single-527"><span class="linenos">527</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-528"><a href="#UISRNN.predict_single-528"><span class="linenos">528</span></a>    <span class="c1"># bookkeeping for beam search</span>
+</span><span id="UISRNN.predict_single-529"><a href="#UISRNN.predict_single-529"><span class="linenos">529</span></a>    <span class="n">beam_set</span> <span class="o">=</span> <span class="p">[</span><span class="n">BeamState</span><span class="p">()]</span>
+</span><span id="UISRNN.predict_single-530"><a href="#UISRNN.predict_single-530"><span class="linenos">530</span></a>    <span class="k">for</span> <span class="n">num_iter</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">test_iteration</span> <span class="o">*</span> <span class="n">test_sequence_length</span><span class="p">,</span>
+</span><span id="UISRNN.predict_single-531"><a href="#UISRNN.predict_single-531"><span class="linenos">531</span></a>                              <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-532"><a href="#UISRNN.predict_single-532"><span class="linenos">532</span></a>      <span class="n">max_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)</span> <span class="k">for</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="n">beam_set</span><span class="p">])</span>
+</span><span id="UISRNN.predict_single-533"><a href="#UISRNN.predict_single-533"><span class="linenos">533</span></a>      <span class="n">look_ahead_seq</span> <span class="o">=</span> <span class="n">test_sequence</span><span class="p">[</span><span class="n">num_iter</span><span class="p">:</span>  <span class="n">num_iter</span> <span class="o">+</span> <span class="n">args</span><span class="o">.</span><span class="n">look_ahead</span><span class="p">,</span> <span class="p">:]</span>
+</span><span id="UISRNN.predict_single-534"><a href="#UISRNN.predict_single-534"><span class="linenos">534</span></a>      <span class="n">look_ahead_seq_length</span> <span class="o">=</span> <span class="n">look_ahead_seq</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="UISRNN.predict_single-535"><a href="#UISRNN.predict_single-535"><span class="linenos">535</span></a>      <span class="n">score_set</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-536"><a href="#UISRNN.predict_single-536"><span class="linenos">536</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-537"><a href="#UISRNN.predict_single-537"><span class="linenos">537</span></a>              <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">+</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-538"><a href="#UISRNN.predict_single-538"><span class="linenos">538</span></a>                  <span class="n">look_ahead_seq_length</span><span class="p">)))</span>
+</span><span id="UISRNN.predict_single-539"><a href="#UISRNN.predict_single-539"><span class="linenos">539</span></a>      <span class="k">for</span> <span class="n">beam_rank</span><span class="p">,</span> <span class="n">beam_state</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">beam_set</span><span class="p">):</span>
+</span><span id="UISRNN.predict_single-540"><a href="#UISRNN.predict_single-540"><span class="linenos">540</span></a>        <span class="n">beam_score_set</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_score</span><span class="p">(</span><span class="n">beam_state</span><span class="p">,</span> <span class="n">look_ahead_seq</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-541"><a href="#UISRNN.predict_single-541"><span class="linenos">541</span></a>        <span class="n">score_set</span><span class="p">[</span><span class="n">beam_rank</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">pad</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-542"><a href="#UISRNN.predict_single-542"><span class="linenos">542</span></a>            <span class="n">beam_score_set</span><span class="p">,</span>
+</span><span id="UISRNN.predict_single-543"><a href="#UISRNN.predict_single-543"><span class="linenos">543</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">tile</span><span class="p">([[</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_clusters</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">beam_state</span><span class="o">.</span><span class="n">mean_set</span><span class="p">)]],</span>
+</span><span id="UISRNN.predict_single-544"><a href="#UISRNN.predict_single-544"><span class="linenos">544</span></a>                    <span class="p">(</span><span class="n">look_ahead_seq_length</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="s1">&#39;constant&#39;</span><span class="p">,</span>
+</span><span id="UISRNN.predict_single-545"><a href="#UISRNN.predict_single-545"><span class="linenos">545</span></a>            <span class="n">constant_values</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">))</span>
+</span><span id="UISRNN.predict_single-546"><a href="#UISRNN.predict_single-546"><span class="linenos">546</span></a>      <span class="c1"># find top scores</span>
+</span><span id="UISRNN.predict_single-547"><a href="#UISRNN.predict_single-547"><span class="linenos">547</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-548"><a href="#UISRNN.predict_single-548"><span class="linenos">548</span></a>      <span class="n">score_ranked</span><span class="p">[</span><span class="n">score_ranked</span> <span class="o">==</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="UISRNN.predict_single-549"><a href="#UISRNN.predict_single-549"><span class="linenos">549</span></a>      <span class="n">score_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">trim_zeros</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-550"><a href="#UISRNN.predict_single-550"><span class="linenos">550</span></a>      <span class="n">idx_ranked</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">score_set</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-551"><a href="#UISRNN.predict_single-551"><span class="linenos">551</span></a>      <span class="n">updated_beam_set</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="UISRNN.predict_single-552"><a href="#UISRNN.predict_single-552"><span class="linenos">552</span></a>      <span class="k">for</span> <span class="n">new_beam_rank</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-553"><a href="#UISRNN.predict_single-553"><span class="linenos">553</span></a>          <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">score_ranked</span><span class="p">),</span> <span class="n">args</span><span class="o">.</span><span class="n">beam_size</span><span class="p">))):</span>
+</span><span id="UISRNN.predict_single-554"><a href="#UISRNN.predict_single-554"><span class="linenos">554</span></a>        <span class="n">total_idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unravel_index</span><span class="p">(</span><span class="n">idx_ranked</span><span class="p">[</span><span class="n">new_beam_rank</span><span class="p">],</span>
+</span><span id="UISRNN.predict_single-555"><a href="#UISRNN.predict_single-555"><span class="linenos">555</span></a>                                     <span class="n">score_set</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-556"><a href="#UISRNN.predict_single-556"><span class="linenos">556</span></a>        <span class="n">prev_beam_rank</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">item</span><span class="p">()</span>
+</span><span id="UISRNN.predict_single-557"><a href="#UISRNN.predict_single-557"><span class="linenos">557</span></a>        <span class="n">cluster_seq</span> <span class="o">=</span> <span class="n">total_idx</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="UISRNN.predict_single-558"><a href="#UISRNN.predict_single-558"><span class="linenos">558</span></a>        <span class="n">updated_beam_state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_update_beam_state</span><span class="p">(</span>
+</span><span id="UISRNN.predict_single-559"><a href="#UISRNN.predict_single-559"><span class="linenos">559</span></a>            <span class="n">beam_set</span><span class="p">[</span><span class="n">prev_beam_rank</span><span class="p">],</span> <span class="n">look_ahead_seq</span><span class="p">,</span> <span class="n">cluster_seq</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-560"><a href="#UISRNN.predict_single-560"><span class="linenos">560</span></a>        <span class="n">updated_beam_set</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">updated_beam_state</span><span class="p">)</span>
+</span><span id="UISRNN.predict_single-561"><a href="#UISRNN.predict_single-561"><span class="linenos">561</span></a>      <span class="n">beam_set</span> <span class="o">=</span> <span class="n">updated_beam_set</span>
+</span><span id="UISRNN.predict_single-562"><a href="#UISRNN.predict_single-562"><span class="linenos">562</span></a>    <span class="n">predicted_cluster_id</span> <span class="o">=</span> <span class="n">beam_set</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">trace</span><span class="p">[</span><span class="o">-</span><span class="n">test_sequence_length</span><span class="p">:]</span>
+</span><span id="UISRNN.predict_single-563"><a href="#UISRNN.predict_single-563"><span class="linenos">563</span></a>    <span class="k">return</span> <span class="n">predicted_cluster_id</span>
 </span></pre></div>
 
 
@@ -2263,9 +2268,12 @@ <h5>Inherited Members</h5>
  [-2.2 5.0 1.8 3.7]    --&gt; 3rd entry of utterance 'iccc'
  [-3.8 0.1 1.4 3.3]    --&gt; 4th entry of utterance 'iccc'
  [0.1 2.7 3.5 -1.7]]   --&gt; 5th entry of utterance 'iccc'
+</code></pre></p>
+
+<pre><code>Here `N=5`, `D=4`.
 </code></pre>
-    Here <code>N=5</code>, <code>D=4</code>.
-  args: Inference configurations. See <code>arguments.py</code> for details.</p>
+
+<p>args: Inference configurations. See <code>arguments.py</code> for details.</p>
 
 <p>Returns:
   predicted_cluster_id: predicted speaker id sequence, which is
@@ -2290,33 +2298,33 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#UISRNN.predict"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict-564"><a href="#UISRNN.predict-564"><span class="linenos">564</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
-</span><span id="UISRNN.predict-565"><a href="#UISRNN.predict-565"><span class="linenos">565</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
-</span><span id="UISRNN.predict-566"><a href="#UISRNN.predict-566"><span class="linenos">566</span></a>
-</span><span id="UISRNN.predict-567"><a href="#UISRNN.predict-567"><span class="linenos">567</span></a><span class="sd">    Args:</span>
-</span><span id="UISRNN.predict-568"><a href="#UISRNN.predict-568"><span class="linenos">568</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
-</span><span id="UISRNN.predict-569"><a href="#UISRNN.predict-569"><span class="linenos">569</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="UISRNN.predict-570"><a href="#UISRNN.predict-570"><span class="linenos">570</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
-</span><span id="UISRNN.predict-571"><a href="#UISRNN.predict-571"><span class="linenos">571</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="UISRNN.predict-572"><a href="#UISRNN.predict-572"><span class="linenos">572</span></a>
-</span><span id="UISRNN.predict-573"><a href="#UISRNN.predict-573"><span class="linenos">573</span></a><span class="sd">    Returns:</span>
-</span><span id="UISRNN.predict-574"><a href="#UISRNN.predict-574"><span class="linenos">574</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
-</span><span id="UISRNN.predict-575"><a href="#UISRNN.predict-575"><span class="linenos">575</span></a>
-</span><span id="UISRNN.predict-576"><a href="#UISRNN.predict-576"><span class="linenos">576</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
-</span><span id="UISRNN.predict-577"><a href="#UISRNN.predict-577"><span class="linenos">577</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
-</span><span id="UISRNN.predict-578"><a href="#UISRNN.predict-578"><span class="linenos">578</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
-</span><span id="UISRNN.predict-579"><a href="#UISRNN.predict-579"><span class="linenos">579</span></a><span class="sd">           be a 1-dim list of strings</span>
-</span><span id="UISRNN.predict-580"><a href="#UISRNN.predict-580"><span class="linenos">580</span></a>
-</span><span id="UISRNN.predict-581"><a href="#UISRNN.predict-581"><span class="linenos">581</span></a><span class="sd">    Raises:</span>
-</span><span id="UISRNN.predict-582"><a href="#UISRNN.predict-582"><span class="linenos">582</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="UISRNN.predict-583"><a href="#UISRNN.predict-583"><span class="linenos">583</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="UISRNN.predict-584"><a href="#UISRNN.predict-584"><span class="linenos">584</span></a>    <span class="c1"># check type</span>
-</span><span id="UISRNN.predict-585"><a href="#UISRNN.predict-585"><span class="linenos">585</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="UISRNN.predict-586"><a href="#UISRNN.predict-586"><span class="linenos">586</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN.predict-587"><a href="#UISRNN.predict-587"><span class="linenos">587</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="UISRNN.predict-588"><a href="#UISRNN.predict-588"><span class="linenos">588</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="UISRNN.predict-589"><a href="#UISRNN.predict-589"><span class="linenos">589</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
-</span><span id="UISRNN.predict-590"><a href="#UISRNN.predict-590"><span class="linenos">590</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="UISRNN.predict-565"><a href="#UISRNN.predict-565"><span class="linenos">565</span></a>  <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">):</span>
+</span><span id="UISRNN.predict-566"><a href="#UISRNN.predict-566"><span class="linenos">566</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Predict labels for a single or many test sequences using UISRNN model.</span>
+</span><span id="UISRNN.predict-567"><a href="#UISRNN.predict-567"><span class="linenos">567</span></a>
+</span><span id="UISRNN.predict-568"><a href="#UISRNN.predict-568"><span class="linenos">568</span></a><span class="sd">    Args:</span>
+</span><span id="UISRNN.predict-569"><a href="#UISRNN.predict-569"><span class="linenos">569</span></a><span class="sd">      test_sequences: Either a list of test sequences, or a single test</span>
+</span><span id="UISRNN.predict-570"><a href="#UISRNN.predict-570"><span class="linenos">570</span></a><span class="sd">        sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="UISRNN.predict-571"><a href="#UISRNN.predict-571"><span class="linenos">571</span></a><span class="sd">        of real numbers. See `predict_single()` for details.</span>
+</span><span id="UISRNN.predict-572"><a href="#UISRNN.predict-572"><span class="linenos">572</span></a><span class="sd">      args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="UISRNN.predict-573"><a href="#UISRNN.predict-573"><span class="linenos">573</span></a>
+</span><span id="UISRNN.predict-574"><a href="#UISRNN.predict-574"><span class="linenos">574</span></a><span class="sd">    Returns:</span>
+</span><span id="UISRNN.predict-575"><a href="#UISRNN.predict-575"><span class="linenos">575</span></a><span class="sd">      predicted_cluster_ids: Predicted labels for test_sequences.</span>
+</span><span id="UISRNN.predict-576"><a href="#UISRNN.predict-576"><span class="linenos">576</span></a>
+</span><span id="UISRNN.predict-577"><a href="#UISRNN.predict-577"><span class="linenos">577</span></a><span class="sd">        1. if test_sequences is a list, predicted_cluster_ids will be a list</span>
+</span><span id="UISRNN.predict-578"><a href="#UISRNN.predict-578"><span class="linenos">578</span></a><span class="sd">           of the same size, where each element being a 1-dim list of strings.</span>
+</span><span id="UISRNN.predict-579"><a href="#UISRNN.predict-579"><span class="linenos">579</span></a><span class="sd">        2. if test_sequences is a single sequence, predicted_cluster_ids will</span>
+</span><span id="UISRNN.predict-580"><a href="#UISRNN.predict-580"><span class="linenos">580</span></a><span class="sd">           be a 1-dim list of strings</span>
+</span><span id="UISRNN.predict-581"><a href="#UISRNN.predict-581"><span class="linenos">581</span></a>
+</span><span id="UISRNN.predict-582"><a href="#UISRNN.predict-582"><span class="linenos">582</span></a><span class="sd">    Raises:</span>
+</span><span id="UISRNN.predict-583"><a href="#UISRNN.predict-583"><span class="linenos">583</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="UISRNN.predict-584"><a href="#UISRNN.predict-584"><span class="linenos">584</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="UISRNN.predict-585"><a href="#UISRNN.predict-585"><span class="linenos">585</span></a>    <span class="c1"># check type</span>
+</span><span id="UISRNN.predict-586"><a href="#UISRNN.predict-586"><span class="linenos">586</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="UISRNN.predict-587"><a href="#UISRNN.predict-587"><span class="linenos">587</span></a>      <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN.predict-588"><a href="#UISRNN.predict-588"><span class="linenos">588</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="UISRNN.predict-589"><a href="#UISRNN.predict-589"><span class="linenos">589</span></a>      <span class="k">return</span> <span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">predict_single</span><span class="p">(</span><span class="n">test_sequence</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="UISRNN.predict-590"><a href="#UISRNN.predict-590"><span class="linenos">590</span></a>              <span class="k">for</span> <span class="n">test_sequence</span> <span class="ow">in</span> <span class="n">test_sequences</span><span class="p">]</span>
+</span><span id="UISRNN.predict-591"><a href="#UISRNN.predict-591"><span class="linenos">591</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences should be either a list or numpy array.&#39;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -2355,37 +2363,37 @@ <h5>Inherited Members</h5>
 
     </div>
     <a class="headerlink" href="#parallel_predict"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="parallel_predict-593"><a href="#parallel_predict-593"><span class="linenos">593</span></a><span class="k">def</span> <span class="nf">parallel_predict</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">num_processes</span><span class="o">=</span><span class="mi">4</span><span class="p">):</span>
-</span><span id="parallel_predict-594"><a href="#parallel_predict-594"><span class="linenos">594</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Run prediction in parallel using torch.multiprocessing.</span>
-</span><span id="parallel_predict-595"><a href="#parallel_predict-595"><span class="linenos">595</span></a>
-</span><span id="parallel_predict-596"><a href="#parallel_predict-596"><span class="linenos">596</span></a><span class="sd">  This is a beta feature. It makes prediction slower on CPU. But it&#39;s reported</span>
-</span><span id="parallel_predict-597"><a href="#parallel_predict-597"><span class="linenos">597</span></a><span class="sd">  that it makes prediction faster on GPU.</span>
-</span><span id="parallel_predict-598"><a href="#parallel_predict-598"><span class="linenos">598</span></a>
-</span><span id="parallel_predict-599"><a href="#parallel_predict-599"><span class="linenos">599</span></a><span class="sd">  Args:</span>
-</span><span id="parallel_predict-600"><a href="#parallel_predict-600"><span class="linenos">600</span></a><span class="sd">    model: instance of UISRNN model</span>
-</span><span id="parallel_predict-601"><a href="#parallel_predict-601"><span class="linenos">601</span></a><span class="sd">    test_sequences: a list of test sequences, or a single test</span>
-</span><span id="parallel_predict-602"><a href="#parallel_predict-602"><span class="linenos">602</span></a><span class="sd">      sequence. Each test sequence is a 2-dim numpy array</span>
-</span><span id="parallel_predict-603"><a href="#parallel_predict-603"><span class="linenos">603</span></a><span class="sd">      of real numbers. See `predict_single()` for details.</span>
-</span><span id="parallel_predict-604"><a href="#parallel_predict-604"><span class="linenos">604</span></a><span class="sd">    args: Inference configurations. See `arguments.py` for details.</span>
-</span><span id="parallel_predict-605"><a href="#parallel_predict-605"><span class="linenos">605</span></a><span class="sd">    num_processes: number of parallel processes.</span>
-</span><span id="parallel_predict-606"><a href="#parallel_predict-606"><span class="linenos">606</span></a>
-</span><span id="parallel_predict-607"><a href="#parallel_predict-607"><span class="linenos">607</span></a><span class="sd">  Returns:</span>
-</span><span id="parallel_predict-608"><a href="#parallel_predict-608"><span class="linenos">608</span></a><span class="sd">    a list of the same size as test_sequences, where each element</span>
-</span><span id="parallel_predict-609"><a href="#parallel_predict-609"><span class="linenos">609</span></a><span class="sd">    being a 1-dim list of strings.</span>
-</span><span id="parallel_predict-610"><a href="#parallel_predict-610"><span class="linenos">610</span></a>
-</span><span id="parallel_predict-611"><a href="#parallel_predict-611"><span class="linenos">611</span></a><span class="sd">  Raises:</span>
-</span><span id="parallel_predict-612"><a href="#parallel_predict-612"><span class="linenos">612</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
-</span><span id="parallel_predict-613"><a href="#parallel_predict-613"><span class="linenos">613</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="parallel_predict-614"><a href="#parallel_predict-614"><span class="linenos">614</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="parallel_predict-615"><a href="#parallel_predict-615"><span class="linenos">615</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences must be a list.&#39;</span><span class="p">)</span>
-</span><span id="parallel_predict-616"><a href="#parallel_predict-616"><span class="linenos">616</span></a>  <span class="n">ctx</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">get_context</span><span class="p">(</span><span class="s1">&#39;forkserver&#39;</span><span class="p">)</span>
-</span><span id="parallel_predict-617"><a href="#parallel_predict-617"><span class="linenos">617</span></a>  <span class="n">model</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">share_memory</span><span class="p">()</span>
-</span><span id="parallel_predict-618"><a href="#parallel_predict-618"><span class="linenos">618</span></a>  <span class="n">pool</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">num_processes</span><span class="p">)</span>
-</span><span id="parallel_predict-619"><a href="#parallel_predict-619"><span class="linenos">619</span></a>  <span class="n">results</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
-</span><span id="parallel_predict-620"><a href="#parallel_predict-620"><span class="linenos">620</span></a>      <span class="n">functools</span><span class="o">.</span><span class="n">partial</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">predict_single</span><span class="p">,</span> <span class="n">args</span><span class="o">=</span><span class="n">args</span><span class="p">),</span>
-</span><span id="parallel_predict-621"><a href="#parallel_predict-621"><span class="linenos">621</span></a>      <span class="n">test_sequences</span><span class="p">)</span>
-</span><span id="parallel_predict-622"><a href="#parallel_predict-622"><span class="linenos">622</span></a>  <span class="n">pool</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
-</span><span id="parallel_predict-623"><a href="#parallel_predict-623"><span class="linenos">623</span></a>  <span class="k">return</span> <span class="n">results</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="parallel_predict-594"><a href="#parallel_predict-594"><span class="linenos">594</span></a><span class="k">def</span> <span class="nf">parallel_predict</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">test_sequences</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">num_processes</span><span class="o">=</span><span class="mi">4</span><span class="p">):</span>
+</span><span id="parallel_predict-595"><a href="#parallel_predict-595"><span class="linenos">595</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Run prediction in parallel using torch.multiprocessing.</span>
+</span><span id="parallel_predict-596"><a href="#parallel_predict-596"><span class="linenos">596</span></a>
+</span><span id="parallel_predict-597"><a href="#parallel_predict-597"><span class="linenos">597</span></a><span class="sd">  This is a beta feature. It makes prediction slower on CPU. But it&#39;s reported</span>
+</span><span id="parallel_predict-598"><a href="#parallel_predict-598"><span class="linenos">598</span></a><span class="sd">  that it makes prediction faster on GPU.</span>
+</span><span id="parallel_predict-599"><a href="#parallel_predict-599"><span class="linenos">599</span></a>
+</span><span id="parallel_predict-600"><a href="#parallel_predict-600"><span class="linenos">600</span></a><span class="sd">  Args:</span>
+</span><span id="parallel_predict-601"><a href="#parallel_predict-601"><span class="linenos">601</span></a><span class="sd">    model: instance of UISRNN model</span>
+</span><span id="parallel_predict-602"><a href="#parallel_predict-602"><span class="linenos">602</span></a><span class="sd">    test_sequences: a list of test sequences, or a single test</span>
+</span><span id="parallel_predict-603"><a href="#parallel_predict-603"><span class="linenos">603</span></a><span class="sd">      sequence. Each test sequence is a 2-dim numpy array</span>
+</span><span id="parallel_predict-604"><a href="#parallel_predict-604"><span class="linenos">604</span></a><span class="sd">      of real numbers. See `predict_single()` for details.</span>
+</span><span id="parallel_predict-605"><a href="#parallel_predict-605"><span class="linenos">605</span></a><span class="sd">    args: Inference configurations. See `arguments.py` for details.</span>
+</span><span id="parallel_predict-606"><a href="#parallel_predict-606"><span class="linenos">606</span></a><span class="sd">    num_processes: number of parallel processes.</span>
+</span><span id="parallel_predict-607"><a href="#parallel_predict-607"><span class="linenos">607</span></a>
+</span><span id="parallel_predict-608"><a href="#parallel_predict-608"><span class="linenos">608</span></a><span class="sd">  Returns:</span>
+</span><span id="parallel_predict-609"><a href="#parallel_predict-609"><span class="linenos">609</span></a><span class="sd">    a list of the same size as test_sequences, where each element</span>
+</span><span id="parallel_predict-610"><a href="#parallel_predict-610"><span class="linenos">610</span></a><span class="sd">    being a 1-dim list of strings.</span>
+</span><span id="parallel_predict-611"><a href="#parallel_predict-611"><span class="linenos">611</span></a>
+</span><span id="parallel_predict-612"><a href="#parallel_predict-612"><span class="linenos">612</span></a><span class="sd">  Raises:</span>
+</span><span id="parallel_predict-613"><a href="#parallel_predict-613"><span class="linenos">613</span></a><span class="sd">      TypeError: If test_sequences is of wrong type.</span>
+</span><span id="parallel_predict-614"><a href="#parallel_predict-614"><span class="linenos">614</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="parallel_predict-615"><a href="#parallel_predict-615"><span class="linenos">615</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="parallel_predict-616"><a href="#parallel_predict-616"><span class="linenos">616</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;test_sequences must be a list.&#39;</span><span class="p">)</span>
+</span><span id="parallel_predict-617"><a href="#parallel_predict-617"><span class="linenos">617</span></a>  <span class="n">ctx</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">get_context</span><span class="p">(</span><span class="s1">&#39;forkserver&#39;</span><span class="p">)</span>
+</span><span id="parallel_predict-618"><a href="#parallel_predict-618"><span class="linenos">618</span></a>  <span class="n">model</span><span class="o">.</span><span class="n">rnn_model</span><span class="o">.</span><span class="n">share_memory</span><span class="p">()</span>
+</span><span id="parallel_predict-619"><a href="#parallel_predict-619"><span class="linenos">619</span></a>  <span class="n">pool</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">num_processes</span><span class="p">)</span>
+</span><span id="parallel_predict-620"><a href="#parallel_predict-620"><span class="linenos">620</span></a>  <span class="n">results</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">map</span><span class="p">(</span>
+</span><span id="parallel_predict-621"><a href="#parallel_predict-621"><span class="linenos">621</span></a>      <span class="n">functools</span><span class="o">.</span><span class="n">partial</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">predict_single</span><span class="p">,</span> <span class="n">args</span><span class="o">=</span><span class="n">args</span><span class="p">),</span>
+</span><span id="parallel_predict-622"><a href="#parallel_predict-622"><span class="linenos">622</span></a>      <span class="n">test_sequences</span><span class="p">)</span>
+</span><span id="parallel_predict-623"><a href="#parallel_predict-623"><span class="linenos">623</span></a>  <span class="n">pool</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="parallel_predict-624"><a href="#parallel_predict-624"><span class="linenos">624</span></a>  <span class="k">return</span> <span class="n">results</span>
 </span></pre></div>
 
 
diff --git a/docs/uisrnn/utils.html b/docs/uisrnn/utils.html
index 1433f97..a5e04c5 100644
--- a/docs/uisrnn/utils.html
+++ b/docs/uisrnn/utils.html
@@ -3,14 +3,14 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.0.0"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>uisrnn.utils API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
     <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
-    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent }nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
-    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--code);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:.75rem center;margin-bottom:1rem;}.pdoc .alert > em{display:none;}.pdoc .alert > *:last-child{margin-bottom:0;}.pdoc .alert.note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .alert.warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .alert.danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
     <style>/*! custom.css */</style></head>
 <body>
     <nav class="pdoc">
@@ -30,18 +30,6 @@
 
             <h2>API Documentation</h2>
                 <ul class="memberlist">
-            <li>
-                    <a class="class" href="#Logger">Logger</a>
-                            <ul class="memberlist">
-                        <li>
-                                <a class="function" href="#Logger.__init__">Logger</a>
-                        </li>
-                        <li>
-                                <a class="function" href="#Logger.print">print</a>
-                        </li>
-                </ul>
-
-            </li>
             <li>
                     <a class="function" href="#generate_random_string">generate_random_string</a>
             </li>
@@ -112,401 +100,300 @@ <h1 class="modulename">
 </span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">autograd</span>
 </span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>
 </span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>
-</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="k">class</span> <span class="nc">Logger</span><span class="p">:</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;A class for printing logging information to screen.&quot;&quot;&quot;</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="k">def</span> <span class="nf">generate_random_string</span><span class="p">(</span><span class="n">length</span><span class="o">=</span><span class="mi">6</span><span class="p">):</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Generate a random string of upper case letters and digits.</span>
 </span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>
-</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">verbosity</span><span class="p">):</span>
-</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_verbosity</span> <span class="o">=</span> <span class="n">verbosity</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a><span class="sd">  Args:</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="sd">    length: length of the generated string</span>
 </span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>
-</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>  <span class="k">def</span> <span class="nf">print</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">level</span><span class="p">,</span> <span class="n">message</span><span class="p">):</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Print a message if level is not higher than verbosity.</span>
-</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>
-</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="sd">    Args:</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="sd">      level: the level of this message, smaller value means more important</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="sd">      message: the message to be printed</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>    <span class="k">if</span> <span class="n">level</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbosity</span><span class="p">:</span>
-</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>      <span class="nb">print</span><span class="p">(</span><span class="n">message</span><span class="p">)</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="sd">  Returns:</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="sd">    the generated string</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>  <span class="k">return</span> <span class="s1">&#39;&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>      <span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">string</span><span class="o">.</span><span class="n">ascii_uppercase</span> <span class="o">+</span> <span class="n">string</span><span class="o">.</span><span class="n">digits</span><span class="p">)</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>      <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">length</span><span class="p">)])</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="k">def</span> <span class="nf">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">):</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Enforce uniqueness of cluster id across sequences.</span>
 </span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>
-</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="k">def</span> <span class="nf">generate_random_string</span><span class="p">(</span><span class="n">length</span><span class="o">=</span><span class="mi">6</span><span class="p">):</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Generate a random string of upper case letters and digits.</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="sd">  Args:</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="sd">    cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
 </span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>
-</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">  Args:</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">    length: length of the generated string</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">  Returns:</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">    a new list with same length of cluster_ids</span>
 </span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>
-</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">  Returns:</span>
-</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">    the generated string</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">  Raises:</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">    TypeError: if cluster_ids or its element has wrong type</span>
 </span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>  <span class="k">return</span> <span class="s1">&#39;&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>      <span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">string</span><span class="o">.</span><span class="n">ascii_uppercase</span> <span class="o">+</span> <span class="n">string</span><span class="o">.</span><span class="n">digits</span><span class="p">)</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>      <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">length</span><span class="p">)])</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>
-</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>
-</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="k">def</span> <span class="nf">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">):</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Enforce uniqueness of cluster id across sequences.</span>
-</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>
-</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="sd">  Args:</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a><span class="sd">    cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>
-</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="sd">  Returns:</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="sd">    a new list with same length of cluster_ids</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;cluster_ids must be a list&#39;</span><span class="p">)</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>  <span class="n">new_cluster_ids</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>  <span class="k">for</span> <span class="n">cluster_id</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>    <span class="n">sequence_id</span> <span class="o">=</span> <span class="n">generate_random_string</span><span class="p">()</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>      <span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;Elements of cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>    <span class="n">new_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;_&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">sequence_id</span><span class="p">,</span> <span class="n">s</span><span class="p">])</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="n">cluster_id</span><span class="p">]</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>    <span class="n">new_cluster_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster_id</span><span class="p">)</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>  <span class="k">return</span> <span class="n">new_cluster_ids</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>
 </span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>
-</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="sd">  Raises:</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a><span class="sd">    TypeError: if cluster_ids or its element has wrong type</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;cluster_ids must be a list&#39;</span><span class="p">)</span>
-</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>  <span class="n">new_cluster_ids</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>  <span class="k">for</span> <span class="n">cluster_id</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
-</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>    <span class="n">sequence_id</span> <span class="o">=</span> <span class="n">generate_random_string</span><span class="p">()</span>
-</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>      <span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;Elements of cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>    <span class="n">new_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;_&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">sequence_id</span><span class="p">,</span> <span class="n">s</span><span class="p">])</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="n">cluster_id</span><span class="p">]</span>
-</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>    <span class="n">new_cluster_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster_id</span><span class="p">)</span>
-</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>  <span class="k">return</span> <span class="n">new_cluster_ids</span>
-</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>
-</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>
-</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a><span class="k">def</span> <span class="nf">concatenate_training_data</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span>
-</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>                              <span class="n">enforce_uniqueness</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Concatenate training data.</span>
-</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>
-</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a><span class="sd">  Args:</span>
-</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a><span class="sd">    train_sequences: a list of 2-dim numpy arrays to be concatenated</span>
-</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a><span class="sd">    train_cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
-</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a><span class="sd">    enforce_uniqueness: a boolean indicated whether we should enfore uniqueness</span>
-</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a><span class="sd">      to train_cluster_ids</span>
-</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a><span class="sd">    shuffle: whether to randomly shuffle input order</span>
-</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>
-</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="sd">  Returns:</span>
-</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="sd">    concatenated_train_sequence: a 2-dim numpy array</span>
-</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a><span class="sd">    concatenated_train_cluster_id: a list of strings</span>
-</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>
-</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="sd">  Raises:</span>
-</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">    TypeError: if input has wrong type</span>
-</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a><span class="sd">    ValueError: if sizes/dimensions of input or their elements are incorrect</span>
-</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>  <span class="c1"># check input</span>
-</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">)</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span>
-</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>      <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences and train_cluster_ids must be lists&#39;</span><span class="p">)</span>
-</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">):</span>
-</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>        <span class="s1">&#39;train_sequences and train_cluster_ids must have same size&#39;</span><span class="p">)</span>
-</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>  <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>      <span class="n">x</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span> <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="k">else</span> <span class="n">x</span>
-</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>      <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span><span class="p">]</span>
-</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>  <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>  <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span>
-</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>      <span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">)):</span>
-</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>    <span class="n">train_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>      <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="n">observation_dim</span>
-</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>    <span class="k">elif</span> <span class="n">global_observation_dim</span> <span class="o">!=</span> <span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>          <span class="s1">&#39;train_sequences must have consistent observation dimension&#39;</span><span class="p">)</span>
-</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span>
-</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>          <span class="s1">&#39;Elements of train_cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span> <span class="o">!=</span> <span class="n">train_length</span><span class="p">:</span>
-</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>          <span class="s1">&#39;Each train_sequence and its train_cluster_id must have same length&#39;</span><span class="p">)</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="k">def</span> <span class="nf">concatenate_training_data</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>                              <span class="n">enforce_uniqueness</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Concatenate training data.</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a><span class="sd">  Args:</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a><span class="sd">    train_sequences: a list of 2-dim numpy arrays to be concatenated</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a><span class="sd">    train_cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a><span class="sd">    enforce_uniqueness: a boolean indicated whether we should enfore uniqueness</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a><span class="sd">      to train_cluster_ids</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="sd">    shuffle: whether to randomly shuffle input order</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a><span class="sd">  Returns:</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a><span class="sd">    concatenated_train_sequence: a 2-dim numpy array</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a><span class="sd">    concatenated_train_cluster_id: a list of strings</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a><span class="sd">  Raises:</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="sd">    TypeError: if input has wrong type</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a><span class="sd">    ValueError: if sizes/dimensions of input or their elements are incorrect</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>  <span class="c1"># check input</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">)</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>      <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences and train_cluster_ids must be lists&#39;</span><span class="p">)</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">):</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>        <span class="s1">&#39;train_sequences and train_cluster_ids must have same size&#39;</span><span class="p">)</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>  <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>      <span class="n">x</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span> <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="k">else</span> <span class="n">x</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>      <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span><span class="p">]</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>  <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>  <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>      <span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">)):</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>    <span class="n">train_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>      <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="n">observation_dim</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>    <span class="k">elif</span> <span class="n">global_observation_dim</span> <span class="o">!=</span> <span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>          <span class="s1">&#39;train_sequences must have consistent observation dimension&#39;</span><span class="p">)</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>          <span class="s1">&#39;Elements of train_cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span> <span class="o">!=</span> <span class="n">train_length</span><span class="p">:</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>          <span class="s1">&#39;Each train_sequence and its train_cluster_id must have same length&#39;</span><span class="p">)</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>  <span class="c1"># enforce uniqueness</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>  <span class="k">if</span> <span class="n">enforce_uniqueness</span><span class="p">:</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>    <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="n">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">)</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>  <span class="c1"># random shuffle</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>  <span class="k">if</span> <span class="n">shuffle</span><span class="p">:</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>    <span class="n">zipped_input</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">))</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">zipped_input</span><span class="p">)</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>    <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">zipped_input</span><span class="p">)</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>  <span class="c1"># concatenate</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>  <span class="n">concatenated_train_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>  <span class="n">concatenated_train_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">train_cluster_id</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>                                   <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_id</span><span class="p">]</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>  <span class="k">return</span> <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>
 </span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>
-</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>  <span class="c1"># enforce uniqueness</span>
-</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>  <span class="k">if</span> <span class="n">enforce_uniqueness</span><span class="p">:</span>
-</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>    <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="n">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">)</span>
-</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>
-</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>  <span class="c1"># random shuffle</span>
-</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>  <span class="k">if</span> <span class="n">shuffle</span><span class="p">:</span>
-</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>    <span class="n">zipped_input</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">))</span>
-</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">zipped_input</span><span class="p">)</span>
-</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>    <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">zipped_input</span><span class="p">)</span>
-</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>
-</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>  <span class="c1"># concatenate</span>
-</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>  <span class="n">concatenated_train_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>  <span class="n">concatenated_train_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">train_cluster_id</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span>
-</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>                                   <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_id</span><span class="p">]</span>
-</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>  <span class="k">return</span> <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span>
-</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>
-</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>
-</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a><span class="k">def</span> <span class="nf">sample_permuted_segments</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">,</span> <span class="n">number_samples</span><span class="p">):</span>
-</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Sample sequences with permuted blocks.</span>
-</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>
-</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a><span class="sd">  Args:</span>
-</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a><span class="sd">    index_sequence: (integer array, size: L)</span>
-</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a><span class="sd">      - subsequence index</span>
-</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="sd">      For example, index_sequence = [1,2,6,10,11,12].</span>
-</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a><span class="sd">    number_samples: (integer)</span>
-</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a><span class="sd">      - number of subsampled block-preserving permuted sequences.</span>
-</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a><span class="sd">      For example, number_samples = 5</span>
-</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>
-</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a><span class="sd">  Returns:</span>
-</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a><span class="sd">    sampled_index_sequences: (a list of numpy arrays) - a list of subsampled</span>
-</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a><span class="sd">      block-preserving permuted sequences. For example,</span>
-</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a><span class="sd">    ```</span>
-</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a><span class="sd">    sampled_index_sequences =</span>
-</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a><span class="sd">    [[10,11,12,1,2,6],</span>
-</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="sd">     [6,1,2,10,11,12],</span>
-</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a><span class="sd">     [1,2,10,11,12,6],</span>
-</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a><span class="sd">     [6,1,2,10,11,12],</span>
-</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="sd">     [1,2,6,10,11,12]]</span>
-</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a><span class="sd">    ```</span>
-</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a><span class="sd">      The length of &quot;sampled_index_sequences&quot; is &quot;number_samples&quot;.</span>
-</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>  <span class="n">segments</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>    <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span>
-</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>  <span class="k">else</span><span class="p">:</span>
-</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>    <span class="n">prev</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>      <span class="k">if</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">]</span> <span class="o">!=</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)])</span>
-</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>        <span class="n">prev</span> <span class="o">=</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span>
-</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a>      <span class="k">if</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:])</span>
-</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>  <span class="c1"># sample permutations</span>
-</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>  <span class="n">sampled_index_sequences</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>  <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">number_samples</span><span class="p">):</span>
-</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>    <span class="n">segments_array</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>    <span class="n">permutation</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">permutation</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">segments</span><span class="p">))</span>
-</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a>    <span class="k">for</span> <span class="n">permutation_item</span> <span class="ow">in</span> <span class="n">permutation</span><span class="p">:</span>
-</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>      <span class="n">segments_array</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">segments</span><span class="p">[</span><span class="n">permutation_item</span><span class="p">])</span>
-</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>    <span class="n">sampled_index_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">segments_array</span><span class="p">))</span>
-</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>  <span class="k">return</span> <span class="n">sampled_index_sequences</span>
-</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>
-</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>
-</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a><span class="k">def</span> <span class="nf">resize_sequence</span><span class="p">(</span><span class="n">sequence</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">,</span> <span class="n">num_permutations</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Resize sequences for packing and batching.</span>
-</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>
-</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a><span class="sd">  Args:</span>
-</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a><span class="sd">    sequence: (real numpy matrix, size: seq_len*obs_size) - observed sequence</span>
-</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a><span class="sd">    cluster_id: (numpy vector, size: seq_len) - cluster indicator sequence</span>
-</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a><span class="sd">    num_permutations: int - Number of permutations per utterance sampled.</span>
-</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>
-</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a><span class="sd">  Returns:</span>
-</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
-</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a><span class="sd">      cluster in the same list.</span>
-</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
-</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>  <span class="c1"># merge sub-sequences that belong to a single cluster to a single sequence</span>
-</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>  <span class="n">unique_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">)</span>
-</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>  <span class="n">sub_sequences</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>  <span class="n">seq_lengths</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>  <span class="k">if</span> <span class="n">num_permutations</span> <span class="ow">and</span> <span class="n">num_permutations</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
-</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>      <span class="n">sampled_idx_sets</span> <span class="o">=</span> <span class="n">sample_permuted_segments</span><span class="p">(</span><span class="n">idx_set</span><span class="p">,</span> <span class="n">num_permutations</span><span class="p">)</span>
-</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>      <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_permutations</span><span class="p">):</span>
-</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>        <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">sampled_idx_sets</span><span class="p">[</span><span class="n">j</span><span class="p">],</span> <span class="p">:])</span>
-</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>        <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>  <span class="k">else</span><span class="p">:</span>
-</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
-</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
-</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>      <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">idx_set</span><span class="p">,</span> <span class="p">:][</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>      <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>  <span class="k">return</span> <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span>
-</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>
-</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>
-</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a><span class="k">def</span> <span class="nf">pack_sequence</span><span class="p">(</span>
-</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">device</span><span class="p">):</span>
-</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Pack sequences for training.</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a><span class="k">def</span> <span class="nf">sample_permuted_segments</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">,</span> <span class="n">number_samples</span><span class="p">):</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Sample sequences with permuted blocks.</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a><span class="sd">  Args:</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a><span class="sd">    index_sequence: (integer array, size: L)</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a><span class="sd">      - subsequence index</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a><span class="sd">      For example, index_sequence = [1,2,6,10,11,12].</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a><span class="sd">    number_samples: (integer)</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a><span class="sd">      - number of subsampled block-preserving permuted sequences.</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="sd">      For example, number_samples = 5</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a><span class="sd">  Returns:</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a><span class="sd">    sampled_index_sequences: (a list of numpy arrays) - a list of subsampled</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="sd">      block-preserving permuted sequences. For example,</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a><span class="sd">    ```</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a><span class="sd">    sampled_index_sequences =</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a><span class="sd">    [[10,11,12,1,2,6],</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a><span class="sd">     [6,1,2,10,11,12],</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a><span class="sd">     [1,2,10,11,12,6],</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a><span class="sd">     [6,1,2,10,11,12],</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a><span class="sd">     [1,2,6,10,11,12]]</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a><span class="sd">    ```</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a><span class="sd">      The length of &quot;sampled_index_sequences&quot; is &quot;number_samples&quot;.</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>  <span class="n">segments</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>    <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>  <span class="k">else</span><span class="p">:</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>    <span class="n">prev</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>      <span class="k">if</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">]</span> <span class="o">!=</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)])</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>        <span class="n">prev</span> <span class="o">=</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>      <span class="k">if</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:])</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>  <span class="c1"># sample permutations</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>  <span class="n">sampled_index_sequences</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>  <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">number_samples</span><span class="p">):</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>    <span class="n">segments_array</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>    <span class="n">permutation</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">permutation</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">segments</span><span class="p">))</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>    <span class="k">for</span> <span class="n">permutation_item</span> <span class="ow">in</span> <span class="n">permutation</span><span class="p">:</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>      <span class="n">segments_array</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">segments</span><span class="p">[</span><span class="n">permutation_item</span><span class="p">])</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>    <span class="n">sampled_index_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">segments_array</span><span class="p">))</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>  <span class="k">return</span> <span class="n">sampled_index_sequences</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a><span class="k">def</span> <span class="nf">resize_sequence</span><span class="p">(</span><span class="n">sequence</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">,</span> <span class="n">num_permutations</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Resize sequences for packing and batching.</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">  Args:</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="sd">    sequence: (real numpy matrix, size: seq_len*obs_size) - observed sequence</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">    cluster_id: (numpy vector, size: seq_len) - cluster indicator sequence</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">    num_permutations: int - Number of permutations per utterance sampled.</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a><span class="sd">  Returns:</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">      cluster in the same list.</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>  <span class="c1"># merge sub-sequences that belong to a single cluster to a single sequence</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>  <span class="n">unique_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">)</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>  <span class="n">sub_sequences</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>  <span class="n">seq_lengths</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>  <span class="k">if</span> <span class="n">num_permutations</span> <span class="ow">and</span> <span class="n">num_permutations</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>      <span class="n">sampled_idx_sets</span> <span class="o">=</span> <span class="n">sample_permuted_segments</span><span class="p">(</span><span class="n">idx_set</span><span class="p">,</span> <span class="n">num_permutations</span><span class="p">)</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>      <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_permutations</span><span class="p">):</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>        <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">sampled_idx_sets</span><span class="p">[</span><span class="n">j</span><span class="p">],</span> <span class="p">:])</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>        <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>  <span class="k">else</span><span class="p">:</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>      <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">idx_set</span><span class="p">,</span> <span class="p">:][</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>      <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>  <span class="k">return</span> <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a><span class="k">def</span> <span class="nf">pack_sequence</span><span class="p">(</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">device</span><span class="p">):</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Pack sequences for training.</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a><span class="sd">  Args:</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a><span class="sd">      cluster in the same list.</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a><span class="sd">    batch_size: int or None - Run batch learning if batch_size is None. Else,</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a><span class="sd">      run online learning with specified batch size.</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a><span class="sd">    observation_dim: int - dimension for observation vectors</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a><span class="sd">    device: str - Your device. E.g., `cuda:0` or `cpu`.</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a><span class="sd">  Returns:</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a><span class="sd">    packed_rnn_input: (PackedSequence object) packed rnn input</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a><span class="sd">    rnn_truth: ground truth</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>  <span class="n">num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>  <span class="n">sorted_seq_lengths</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>  <span class="n">permute_index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
 </span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>
-</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a><span class="sd">  Args:</span>
-</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
-</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a><span class="sd">      cluster in the same list.</span>
-</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
-</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a><span class="sd">    batch_size: int or None - Run batch learning if batch_size is None. Else,</span>
-</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a><span class="sd">      run online learning with specified batch size.</span>
-</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a><span class="sd">    observation_dim: int - dimension for observation vectors</span>
-</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="sd">    device: str - Your device. E.g., `cuda:0` or `cpu`.</span>
-</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>
-</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="sd">  Returns:</span>
-</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="sd">    packed_rnn_input: (PackedSequence object) packed rnn input</span>
-</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a><span class="sd">    rnn_truth: ground truth</span>
-</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>  <span class="n">num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)</span>
-</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>  <span class="n">sorted_seq_lengths</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>  <span class="n">permute_index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>
-</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>  <span class="k">if</span> <span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
-</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>                          <span class="n">num_clusters</span><span class="p">,</span>
-</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
-</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">):</span>
-</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">i</span><span class="p">,</span>
-</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>                <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
-</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
-</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
-</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>  <span class="k">else</span><span class="p">:</span>
-</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>    <span class="n">mini_batch</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">))</span>
-</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="mi">0</span><span class="p">]],</span>
-</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>                          <span class="n">batch_size</span><span class="p">,</span>
-</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
-</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">batch_size</span><span class="p">):</span>
-</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]],</span>
-</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>                <span class="n">i</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]]]</span>
-</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
-</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
-</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">],</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>  <span class="c1"># ground truth is the shifted input</span>
-</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>  <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:,</span> <span class="p">:,</span> <span class="p">:]</span>
-</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>  <span class="k">return</span> <span class="n">packed_rnn_input</span><span class="p">,</span> <span class="n">rnn_truth</span>
-</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>
-</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>
-</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a><span class="k">def</span> <span class="nf">output_result</span><span class="p">(</span><span class="n">model_args</span><span class="p">,</span> <span class="n">training_args</span><span class="p">,</span> <span class="n">test_record</span><span class="p">):</span>
-</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Produce a string to summarize the experiment.&quot;&quot;&quot;</span>
-</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>  <span class="n">accuracy_array</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">test_record</span><span class="p">)</span>
-</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>  <span class="n">total_accuracy</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">accuracy_array</span><span class="p">)</span>
-</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>  <span class="n">output_string</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
-</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a><span class="s2">Config:</span>
-</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a><span class="s2">  sigma_alpha: </span><span class="si">{}</span>
-</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a><span class="s2">  sigma_beta: </span><span class="si">{}</span>
-</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="s2">  crp_alpha: </span><span class="si">{}</span>
-</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a><span class="s2">  learning rate: </span><span class="si">{}</span>
-</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a><span class="s2">  regularization: </span><span class="si">{}</span>
-</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a><span class="s2">  batch size: </span><span class="si">{}</span>
-</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>
-</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a><span class="s2">Performance:</span>
-</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a><span class="s2">  averaged accuracy: </span><span class="si">{:.6f}</span>
-</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a><span class="s2">  accuracy numbers for all testing sequences:</span>
-</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a><span class="s2">  &quot;&quot;&quot;</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span>
-</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span>
-</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span>
-</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">,</span>
-</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>      <span class="n">total_accuracy</span><span class="p">)</span>
-</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>  <span class="k">for</span> <span class="n">accuracy</span> <span class="ow">in</span> <span class="n">accuracy_array</span><span class="p">:</span>
-</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>    <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">    </span><span class="si">{:.6f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy</span><span class="p">)</span>
-</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>  <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span> <span class="o">+</span> <span class="s1">&#39;=&#39;</span> <span class="o">*</span> <span class="mi">80</span> <span class="o">+</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>  <span class="n">filename</span> <span class="o">=</span> <span class="s1">&#39;layer_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{:.1f}</span><span class="s1">_result.txt&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span>
-</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s1">&#39;a&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file_object</span><span class="p">:</span>
-</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>    <span class="n">file_object</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">output_string</span><span class="p">)</span>
-</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>  <span class="k">return</span> <span class="n">output_string</span>
-</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>
-</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>
-</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a><span class="k">def</span> <span class="nf">estimate_transition_bias</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="n">smooth</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
-</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Estimate the transition bias.</span>
-</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>
-</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="sd">  Args:</span>
-</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a><span class="sd">    cluster_id: Either a list of cluster indicator sequences, or a single</span>
-</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a><span class="sd">      concatenated sequence. The former is strongly preferred, since the</span>
-</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a><span class="sd">      transition_bias estimated from the latter will be inaccurate.</span>
-</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a><span class="sd">    smooth: int or float - Smoothing coefficient, avoids -inf value in np.log</span>
-</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a><span class="sd">      in the case of a sequence with a single speaker and division by 0 in the</span>
-</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a><span class="sd">      case of empty sequences. Using a small value for smooth decreases the</span>
-</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a><span class="sd">      bias in the calculation of transition_bias but can also lead to underflow</span>
-</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a><span class="sd">      in some remote cases, larger values are safer but less accurate.</span>
-</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>
-</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a><span class="sd">  Returns:</span>
-</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a><span class="sd">    bias: Flipping coin head probability.</span>
-</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a><span class="sd">    bias_denominator: The denominator of the bias, used for multiple calls to</span>
-</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a><span class="sd">      fit().</span>
-</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>  <span class="n">transit_num</span> <span class="o">=</span> <span class="n">smooth</span>
-</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a>  <span class="n">bias_denominator</span> <span class="o">=</span> <span class="mi">2</span> <span class="o">*</span> <span class="n">smooth</span>
-</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>  <span class="k">for</span> <span class="n">cluster_id_seq</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
-</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>    <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>      <span class="n">transit_num</span> <span class="o">+=</span> <span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span><span class="p">]</span> <span class="o">!=</span> <span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span> <span class="o">+</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>      <span class="n">bias_denominator</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>  <span class="n">bias</span> <span class="o">=</span> <span class="n">transit_num</span> <span class="o">/</span> <span class="n">bias_denominator</span>
-</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>  <span class="k">return</span> <span class="n">bias</span><span class="p">,</span> <span class="n">bias_denominator</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>  <span class="k">if</span> <span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>                          <span class="n">num_clusters</span><span class="p">,</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">):</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">i</span><span class="p">,</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>                <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>  <span class="k">else</span><span class="p">:</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>    <span class="n">mini_batch</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">))</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="mi">0</span><span class="p">]],</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>                          <span class="n">batch_size</span><span class="p">,</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">batch_size</span><span class="p">):</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]],</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>                <span class="n">i</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]]]</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">],</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>  <span class="c1"># ground truth is the shifted input</span>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>  <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:,</span> <span class="p">:,</span> <span class="p">:]</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>  <span class="k">return</span> <span class="n">packed_rnn_input</span><span class="p">,</span> <span class="n">rnn_truth</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a><span class="k">def</span> <span class="nf">output_result</span><span class="p">(</span><span class="n">model_args</span><span class="p">,</span> <span class="n">training_args</span><span class="p">,</span> <span class="n">test_record</span><span class="p">):</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Produce a string to summarize the experiment.&quot;&quot;&quot;</span>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>  <span class="n">accuracy_array</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">test_record</span><span class="p">)</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>  <span class="n">total_accuracy</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">accuracy_array</span><span class="p">)</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>  <span class="n">output_string</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a><span class="s2">Config:</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a><span class="s2">  sigma_alpha: </span><span class="si">{}</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a><span class="s2">  sigma_beta: </span><span class="si">{}</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a><span class="s2">  crp_alpha: </span><span class="si">{}</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a><span class="s2">  learning rate: </span><span class="si">{}</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a><span class="s2">  regularization: </span><span class="si">{}</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a><span class="s2">  batch size: </span><span class="si">{}</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a><span class="s2">Performance:</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a><span class="s2">  averaged accuracy: </span><span class="si">{:.6f}</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a><span class="s2">  accuracy numbers for all testing sequences:</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a><span class="s2">  &quot;&quot;&quot;</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">,</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>      <span class="n">total_accuracy</span><span class="p">)</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>  <span class="k">for</span> <span class="n">accuracy</span> <span class="ow">in</span> <span class="n">accuracy_array</span><span class="p">:</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a>    <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">    </span><span class="si">{:.6f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy</span><span class="p">)</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>  <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span> <span class="o">+</span> <span class="s1">&#39;=&#39;</span> <span class="o">*</span> <span class="mi">80</span> <span class="o">+</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>  <span class="n">filename</span> <span class="o">=</span> <span class="s1">&#39;layer_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{:.1f}</span><span class="s1">_result.txt&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s1">&#39;a&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file_object</span><span class="p">:</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>    <span class="n">file_object</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">output_string</span><span class="p">)</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>  <span class="k">return</span> <span class="n">output_string</span>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a><span class="k">def</span> <span class="nf">estimate_transition_bias</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="n">smooth</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Estimate the transition bias.</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a><span class="sd">  Args:</span>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a><span class="sd">    cluster_id: Either a list of cluster indicator sequences, or a single</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a><span class="sd">      concatenated sequence. The former is strongly preferred, since the</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a><span class="sd">      transition_bias estimated from the latter will be inaccurate.</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a><span class="sd">    smooth: int or float - Smoothing coefficient, avoids -inf value in np.log</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a><span class="sd">      in the case of a sequence with a single speaker and division by 0 in the</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a><span class="sd">      case of empty sequences. Using a small value for smooth decreases the</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a><span class="sd">      bias in the calculation of transition_bias but can also lead to underflow</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a><span class="sd">      in some remote cases, larger values are safer but less accurate.</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a><span class="sd">  Returns:</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a><span class="sd">    bias: Flipping coin head probability.</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a><span class="sd">    bias_denominator: The denominator of the bias, used for multiple calls to</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a><span class="sd">      fit().</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>  <span class="n">transit_num</span> <span class="o">=</span> <span class="n">smooth</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>  <span class="n">bias_denominator</span> <span class="o">=</span> <span class="mi">2</span> <span class="o">*</span> <span class="n">smooth</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a>  <span class="k">for</span> <span class="n">cluster_id_seq</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>    <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>      <span class="n">transit_num</span> <span class="o">+=</span> <span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span><span class="p">]</span> <span class="o">!=</span> <span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span> <span class="o">+</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>      <span class="n">bias_denominator</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>  <span class="n">bias</span> <span class="o">=</span> <span class="n">transit_num</span> <span class="o">/</span> <span class="n">bias_denominator</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>  <span class="k">return</span> <span class="n">bias</span><span class="p">,</span> <span class="n">bias_denominator</span>
 </span></pre></div>
 
 
             </section>
-                <section id="Logger">
-                            <input id="Logger-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
-<div class="attr class">
-            
-    <span class="def">class</span>
-    <span class="name">Logger</span>:
-
-                <label class="view-source-button" for="Logger-view-source"><span>View Source</span></label>
-
-    </div>
-    <a class="headerlink" href="#Logger"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="Logger-25"><a href="#Logger-25"><span class="linenos">25</span></a><span class="k">class</span> <span class="nc">Logger</span><span class="p">:</span>
-</span><span id="Logger-26"><a href="#Logger-26"><span class="linenos">26</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;A class for printing logging information to screen.&quot;&quot;&quot;</span>
-</span><span id="Logger-27"><a href="#Logger-27"><span class="linenos">27</span></a>
-</span><span id="Logger-28"><a href="#Logger-28"><span class="linenos">28</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">verbosity</span><span class="p">):</span>
-</span><span id="Logger-29"><a href="#Logger-29"><span class="linenos">29</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_verbosity</span> <span class="o">=</span> <span class="n">verbosity</span>
-</span><span id="Logger-30"><a href="#Logger-30"><span class="linenos">30</span></a>
-</span><span id="Logger-31"><a href="#Logger-31"><span class="linenos">31</span></a>  <span class="k">def</span> <span class="nf">print</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">level</span><span class="p">,</span> <span class="n">message</span><span class="p">):</span>
-</span><span id="Logger-32"><a href="#Logger-32"><span class="linenos">32</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Print a message if level is not higher than verbosity.</span>
-</span><span id="Logger-33"><a href="#Logger-33"><span class="linenos">33</span></a>
-</span><span id="Logger-34"><a href="#Logger-34"><span class="linenos">34</span></a><span class="sd">    Args:</span>
-</span><span id="Logger-35"><a href="#Logger-35"><span class="linenos">35</span></a><span class="sd">      level: the level of this message, smaller value means more important</span>
-</span><span id="Logger-36"><a href="#Logger-36"><span class="linenos">36</span></a><span class="sd">      message: the message to be printed</span>
-</span><span id="Logger-37"><a href="#Logger-37"><span class="linenos">37</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="Logger-38"><a href="#Logger-38"><span class="linenos">38</span></a>    <span class="k">if</span> <span class="n">level</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbosity</span><span class="p">:</span>
-</span><span id="Logger-39"><a href="#Logger-39"><span class="linenos">39</span></a>      <span class="nb">print</span><span class="p">(</span><span class="n">message</span><span class="p">)</span>
-</span></pre></div>
-
-
-            <div class="docstring"><p>A class for printing logging information to screen.</p>
-</div>
-
-
-                            <div id="Logger.__init__" class="classattr">
-                                        <input id="Logger.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
-<div class="attr function">
-            
-        <span class="name">Logger</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">verbosity</span></span>)</span>
-
-                <label class="view-source-button" for="Logger.__init__-view-source"><span>View Source</span></label>
-
-    </div>
-    <a class="headerlink" href="#Logger.__init__"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="Logger.__init__-28"><a href="#Logger.__init__-28"><span class="linenos">28</span></a>  <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">verbosity</span><span class="p">):</span>
-</span><span id="Logger.__init__-29"><a href="#Logger.__init__-29"><span class="linenos">29</span></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_verbosity</span> <span class="o">=</span> <span class="n">verbosity</span>
-</span></pre></div>
-
-
-    
-
-                            </div>
-                            <div id="Logger.print" class="classattr">
-                                        <input id="Logger.print-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
-<div class="attr function">
-            
-        <span class="def">def</span>
-        <span class="name">print</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">level</span>, </span><span class="param"><span class="n">message</span></span><span class="return-annotation">):</span></span>
-
-                <label class="view-source-button" for="Logger.print-view-source"><span>View Source</span></label>
-
-    </div>
-    <a class="headerlink" href="#Logger.print"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="Logger.print-31"><a href="#Logger.print-31"><span class="linenos">31</span></a>  <span class="k">def</span> <span class="nf">print</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">level</span><span class="p">,</span> <span class="n">message</span><span class="p">):</span>
-</span><span id="Logger.print-32"><a href="#Logger.print-32"><span class="linenos">32</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Print a message if level is not higher than verbosity.</span>
-</span><span id="Logger.print-33"><a href="#Logger.print-33"><span class="linenos">33</span></a>
-</span><span id="Logger.print-34"><a href="#Logger.print-34"><span class="linenos">34</span></a><span class="sd">    Args:</span>
-</span><span id="Logger.print-35"><a href="#Logger.print-35"><span class="linenos">35</span></a><span class="sd">      level: the level of this message, smaller value means more important</span>
-</span><span id="Logger.print-36"><a href="#Logger.print-36"><span class="linenos">36</span></a><span class="sd">      message: the message to be printed</span>
-</span><span id="Logger.print-37"><a href="#Logger.print-37"><span class="linenos">37</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="Logger.print-38"><a href="#Logger.print-38"><span class="linenos">38</span></a>    <span class="k">if</span> <span class="n">level</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbosity</span><span class="p">:</span>
-</span><span id="Logger.print-39"><a href="#Logger.print-39"><span class="linenos">39</span></a>      <span class="nb">print</span><span class="p">(</span><span class="n">message</span><span class="p">)</span>
-</span></pre></div>
-
-
-            <div class="docstring"><p>Print a message if level is not higher than verbosity.</p>
-
-<p>Args:
-  level: the level of this message, smaller value means more important
-  message: the message to be printed</p>
-</div>
-
-
-                            </div>
-                </section>
                 <section id="generate_random_string">
                             <input id="generate_random_string-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
@@ -518,18 +405,18 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#generate_random_string"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="generate_random_string-42"><a href="#generate_random_string-42"><span class="linenos">42</span></a><span class="k">def</span> <span class="nf">generate_random_string</span><span class="p">(</span><span class="n">length</span><span class="o">=</span><span class="mi">6</span><span class="p">):</span>
-</span><span id="generate_random_string-43"><a href="#generate_random_string-43"><span class="linenos">43</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Generate a random string of upper case letters and digits.</span>
-</span><span id="generate_random_string-44"><a href="#generate_random_string-44"><span class="linenos">44</span></a>
-</span><span id="generate_random_string-45"><a href="#generate_random_string-45"><span class="linenos">45</span></a><span class="sd">  Args:</span>
-</span><span id="generate_random_string-46"><a href="#generate_random_string-46"><span class="linenos">46</span></a><span class="sd">    length: length of the generated string</span>
-</span><span id="generate_random_string-47"><a href="#generate_random_string-47"><span class="linenos">47</span></a>
-</span><span id="generate_random_string-48"><a href="#generate_random_string-48"><span class="linenos">48</span></a><span class="sd">  Returns:</span>
-</span><span id="generate_random_string-49"><a href="#generate_random_string-49"><span class="linenos">49</span></a><span class="sd">    the generated string</span>
-</span><span id="generate_random_string-50"><a href="#generate_random_string-50"><span class="linenos">50</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="generate_random_string-51"><a href="#generate_random_string-51"><span class="linenos">51</span></a>  <span class="k">return</span> <span class="s1">&#39;&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span>
-</span><span id="generate_random_string-52"><a href="#generate_random_string-52"><span class="linenos">52</span></a>      <span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">string</span><span class="o">.</span><span class="n">ascii_uppercase</span> <span class="o">+</span> <span class="n">string</span><span class="o">.</span><span class="n">digits</span><span class="p">)</span>
-</span><span id="generate_random_string-53"><a href="#generate_random_string-53"><span class="linenos">53</span></a>      <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">length</span><span class="p">)])</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="generate_random_string-25"><a href="#generate_random_string-25"><span class="linenos">25</span></a><span class="k">def</span> <span class="nf">generate_random_string</span><span class="p">(</span><span class="n">length</span><span class="o">=</span><span class="mi">6</span><span class="p">):</span>
+</span><span id="generate_random_string-26"><a href="#generate_random_string-26"><span class="linenos">26</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Generate a random string of upper case letters and digits.</span>
+</span><span id="generate_random_string-27"><a href="#generate_random_string-27"><span class="linenos">27</span></a>
+</span><span id="generate_random_string-28"><a href="#generate_random_string-28"><span class="linenos">28</span></a><span class="sd">  Args:</span>
+</span><span id="generate_random_string-29"><a href="#generate_random_string-29"><span class="linenos">29</span></a><span class="sd">    length: length of the generated string</span>
+</span><span id="generate_random_string-30"><a href="#generate_random_string-30"><span class="linenos">30</span></a>
+</span><span id="generate_random_string-31"><a href="#generate_random_string-31"><span class="linenos">31</span></a><span class="sd">  Returns:</span>
+</span><span id="generate_random_string-32"><a href="#generate_random_string-32"><span class="linenos">32</span></a><span class="sd">    the generated string</span>
+</span><span id="generate_random_string-33"><a href="#generate_random_string-33"><span class="linenos">33</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="generate_random_string-34"><a href="#generate_random_string-34"><span class="linenos">34</span></a>  <span class="k">return</span> <span class="s1">&#39;&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span>
+</span><span id="generate_random_string-35"><a href="#generate_random_string-35"><span class="linenos">35</span></a>      <span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">string</span><span class="o">.</span><span class="n">ascii_uppercase</span> <span class="o">+</span> <span class="n">string</span><span class="o">.</span><span class="n">digits</span><span class="p">)</span>
+</span><span id="generate_random_string-36"><a href="#generate_random_string-36"><span class="linenos">36</span></a>      <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">length</span><span class="p">)])</span>
 </span></pre></div>
 
 
@@ -555,30 +442,30 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#enforce_cluster_id_uniqueness"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="enforce_cluster_id_uniqueness-56"><a href="#enforce_cluster_id_uniqueness-56"><span class="linenos">56</span></a><span class="k">def</span> <span class="nf">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">):</span>
-</span><span id="enforce_cluster_id_uniqueness-57"><a href="#enforce_cluster_id_uniqueness-57"><span class="linenos">57</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Enforce uniqueness of cluster id across sequences.</span>
-</span><span id="enforce_cluster_id_uniqueness-58"><a href="#enforce_cluster_id_uniqueness-58"><span class="linenos">58</span></a>
-</span><span id="enforce_cluster_id_uniqueness-59"><a href="#enforce_cluster_id_uniqueness-59"><span class="linenos">59</span></a><span class="sd">  Args:</span>
-</span><span id="enforce_cluster_id_uniqueness-60"><a href="#enforce_cluster_id_uniqueness-60"><span class="linenos">60</span></a><span class="sd">    cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
-</span><span id="enforce_cluster_id_uniqueness-61"><a href="#enforce_cluster_id_uniqueness-61"><span class="linenos">61</span></a>
-</span><span id="enforce_cluster_id_uniqueness-62"><a href="#enforce_cluster_id_uniqueness-62"><span class="linenos">62</span></a><span class="sd">  Returns:</span>
-</span><span id="enforce_cluster_id_uniqueness-63"><a href="#enforce_cluster_id_uniqueness-63"><span class="linenos">63</span></a><span class="sd">    a new list with same length of cluster_ids</span>
-</span><span id="enforce_cluster_id_uniqueness-64"><a href="#enforce_cluster_id_uniqueness-64"><span class="linenos">64</span></a>
-</span><span id="enforce_cluster_id_uniqueness-65"><a href="#enforce_cluster_id_uniqueness-65"><span class="linenos">65</span></a><span class="sd">  Raises:</span>
-</span><span id="enforce_cluster_id_uniqueness-66"><a href="#enforce_cluster_id_uniqueness-66"><span class="linenos">66</span></a><span class="sd">    TypeError: if cluster_ids or its element has wrong type</span>
-</span><span id="enforce_cluster_id_uniqueness-67"><a href="#enforce_cluster_id_uniqueness-67"><span class="linenos">67</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="enforce_cluster_id_uniqueness-68"><a href="#enforce_cluster_id_uniqueness-68"><span class="linenos">68</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="enforce_cluster_id_uniqueness-69"><a href="#enforce_cluster_id_uniqueness-69"><span class="linenos">69</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;cluster_ids must be a list&#39;</span><span class="p">)</span>
-</span><span id="enforce_cluster_id_uniqueness-70"><a href="#enforce_cluster_id_uniqueness-70"><span class="linenos">70</span></a>  <span class="n">new_cluster_ids</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="enforce_cluster_id_uniqueness-71"><a href="#enforce_cluster_id_uniqueness-71"><span class="linenos">71</span></a>  <span class="k">for</span> <span class="n">cluster_id</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
-</span><span id="enforce_cluster_id_uniqueness-72"><a href="#enforce_cluster_id_uniqueness-72"><span class="linenos">72</span></a>    <span class="n">sequence_id</span> <span class="o">=</span> <span class="n">generate_random_string</span><span class="p">()</span>
-</span><span id="enforce_cluster_id_uniqueness-73"><a href="#enforce_cluster_id_uniqueness-73"><span class="linenos">73</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="enforce_cluster_id_uniqueness-74"><a href="#enforce_cluster_id_uniqueness-74"><span class="linenos">74</span></a>      <span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="enforce_cluster_id_uniqueness-75"><a href="#enforce_cluster_id_uniqueness-75"><span class="linenos">75</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="enforce_cluster_id_uniqueness-76"><a href="#enforce_cluster_id_uniqueness-76"><span class="linenos">76</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;Elements of cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="enforce_cluster_id_uniqueness-77"><a href="#enforce_cluster_id_uniqueness-77"><span class="linenos">77</span></a>    <span class="n">new_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;_&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">sequence_id</span><span class="p">,</span> <span class="n">s</span><span class="p">])</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="n">cluster_id</span><span class="p">]</span>
-</span><span id="enforce_cluster_id_uniqueness-78"><a href="#enforce_cluster_id_uniqueness-78"><span class="linenos">78</span></a>    <span class="n">new_cluster_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster_id</span><span class="p">)</span>
-</span><span id="enforce_cluster_id_uniqueness-79"><a href="#enforce_cluster_id_uniqueness-79"><span class="linenos">79</span></a>  <span class="k">return</span> <span class="n">new_cluster_ids</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="enforce_cluster_id_uniqueness-39"><a href="#enforce_cluster_id_uniqueness-39"><span class="linenos">39</span></a><span class="k">def</span> <span class="nf">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">):</span>
+</span><span id="enforce_cluster_id_uniqueness-40"><a href="#enforce_cluster_id_uniqueness-40"><span class="linenos">40</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Enforce uniqueness of cluster id across sequences.</span>
+</span><span id="enforce_cluster_id_uniqueness-41"><a href="#enforce_cluster_id_uniqueness-41"><span class="linenos">41</span></a>
+</span><span id="enforce_cluster_id_uniqueness-42"><a href="#enforce_cluster_id_uniqueness-42"><span class="linenos">42</span></a><span class="sd">  Args:</span>
+</span><span id="enforce_cluster_id_uniqueness-43"><a href="#enforce_cluster_id_uniqueness-43"><span class="linenos">43</span></a><span class="sd">    cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
+</span><span id="enforce_cluster_id_uniqueness-44"><a href="#enforce_cluster_id_uniqueness-44"><span class="linenos">44</span></a>
+</span><span id="enforce_cluster_id_uniqueness-45"><a href="#enforce_cluster_id_uniqueness-45"><span class="linenos">45</span></a><span class="sd">  Returns:</span>
+</span><span id="enforce_cluster_id_uniqueness-46"><a href="#enforce_cluster_id_uniqueness-46"><span class="linenos">46</span></a><span class="sd">    a new list with same length of cluster_ids</span>
+</span><span id="enforce_cluster_id_uniqueness-47"><a href="#enforce_cluster_id_uniqueness-47"><span class="linenos">47</span></a>
+</span><span id="enforce_cluster_id_uniqueness-48"><a href="#enforce_cluster_id_uniqueness-48"><span class="linenos">48</span></a><span class="sd">  Raises:</span>
+</span><span id="enforce_cluster_id_uniqueness-49"><a href="#enforce_cluster_id_uniqueness-49"><span class="linenos">49</span></a><span class="sd">    TypeError: if cluster_ids or its element has wrong type</span>
+</span><span id="enforce_cluster_id_uniqueness-50"><a href="#enforce_cluster_id_uniqueness-50"><span class="linenos">50</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="enforce_cluster_id_uniqueness-51"><a href="#enforce_cluster_id_uniqueness-51"><span class="linenos">51</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="enforce_cluster_id_uniqueness-52"><a href="#enforce_cluster_id_uniqueness-52"><span class="linenos">52</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;cluster_ids must be a list&#39;</span><span class="p">)</span>
+</span><span id="enforce_cluster_id_uniqueness-53"><a href="#enforce_cluster_id_uniqueness-53"><span class="linenos">53</span></a>  <span class="n">new_cluster_ids</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="enforce_cluster_id_uniqueness-54"><a href="#enforce_cluster_id_uniqueness-54"><span class="linenos">54</span></a>  <span class="k">for</span> <span class="n">cluster_id</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
+</span><span id="enforce_cluster_id_uniqueness-55"><a href="#enforce_cluster_id_uniqueness-55"><span class="linenos">55</span></a>    <span class="n">sequence_id</span> <span class="o">=</span> <span class="n">generate_random_string</span><span class="p">()</span>
+</span><span id="enforce_cluster_id_uniqueness-56"><a href="#enforce_cluster_id_uniqueness-56"><span class="linenos">56</span></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="enforce_cluster_id_uniqueness-57"><a href="#enforce_cluster_id_uniqueness-57"><span class="linenos">57</span></a>      <span class="n">cluster_id</span> <span class="o">=</span> <span class="n">cluster_id</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="enforce_cluster_id_uniqueness-58"><a href="#enforce_cluster_id_uniqueness-58"><span class="linenos">58</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="enforce_cluster_id_uniqueness-59"><a href="#enforce_cluster_id_uniqueness-59"><span class="linenos">59</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;Elements of cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="enforce_cluster_id_uniqueness-60"><a href="#enforce_cluster_id_uniqueness-60"><span class="linenos">60</span></a>    <span class="n">new_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;_&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">sequence_id</span><span class="p">,</span> <span class="n">s</span><span class="p">])</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="n">cluster_id</span><span class="p">]</span>
+</span><span id="enforce_cluster_id_uniqueness-61"><a href="#enforce_cluster_id_uniqueness-61"><span class="linenos">61</span></a>    <span class="n">new_cluster_ids</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">new_cluster_id</span><span class="p">)</span>
+</span><span id="enforce_cluster_id_uniqueness-62"><a href="#enforce_cluster_id_uniqueness-62"><span class="linenos">62</span></a>  <span class="k">return</span> <span class="n">new_cluster_ids</span>
 </span></pre></div>
 
 
@@ -607,66 +494,66 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#concatenate_training_data"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="concatenate_training_data-82"><a href="#concatenate_training_data-82"><span class="linenos"> 82</span></a><span class="k">def</span> <span class="nf">concatenate_training_data</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span>
-</span><span id="concatenate_training_data-83"><a href="#concatenate_training_data-83"><span class="linenos"> 83</span></a>                              <span class="n">enforce_uniqueness</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-</span><span id="concatenate_training_data-84"><a href="#concatenate_training_data-84"><span class="linenos"> 84</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Concatenate training data.</span>
-</span><span id="concatenate_training_data-85"><a href="#concatenate_training_data-85"><span class="linenos"> 85</span></a>
-</span><span id="concatenate_training_data-86"><a href="#concatenate_training_data-86"><span class="linenos"> 86</span></a><span class="sd">  Args:</span>
-</span><span id="concatenate_training_data-87"><a href="#concatenate_training_data-87"><span class="linenos"> 87</span></a><span class="sd">    train_sequences: a list of 2-dim numpy arrays to be concatenated</span>
-</span><span id="concatenate_training_data-88"><a href="#concatenate_training_data-88"><span class="linenos"> 88</span></a><span class="sd">    train_cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
-</span><span id="concatenate_training_data-89"><a href="#concatenate_training_data-89"><span class="linenos"> 89</span></a><span class="sd">    enforce_uniqueness: a boolean indicated whether we should enfore uniqueness</span>
-</span><span id="concatenate_training_data-90"><a href="#concatenate_training_data-90"><span class="linenos"> 90</span></a><span class="sd">      to train_cluster_ids</span>
-</span><span id="concatenate_training_data-91"><a href="#concatenate_training_data-91"><span class="linenos"> 91</span></a><span class="sd">    shuffle: whether to randomly shuffle input order</span>
-</span><span id="concatenate_training_data-92"><a href="#concatenate_training_data-92"><span class="linenos"> 92</span></a>
-</span><span id="concatenate_training_data-93"><a href="#concatenate_training_data-93"><span class="linenos"> 93</span></a><span class="sd">  Returns:</span>
-</span><span id="concatenate_training_data-94"><a href="#concatenate_training_data-94"><span class="linenos"> 94</span></a><span class="sd">    concatenated_train_sequence: a 2-dim numpy array</span>
-</span><span id="concatenate_training_data-95"><a href="#concatenate_training_data-95"><span class="linenos"> 95</span></a><span class="sd">    concatenated_train_cluster_id: a list of strings</span>
-</span><span id="concatenate_training_data-96"><a href="#concatenate_training_data-96"><span class="linenos"> 96</span></a>
-</span><span id="concatenate_training_data-97"><a href="#concatenate_training_data-97"><span class="linenos"> 97</span></a><span class="sd">  Raises:</span>
-</span><span id="concatenate_training_data-98"><a href="#concatenate_training_data-98"><span class="linenos"> 98</span></a><span class="sd">    TypeError: if input has wrong type</span>
-</span><span id="concatenate_training_data-99"><a href="#concatenate_training_data-99"><span class="linenos"> 99</span></a><span class="sd">    ValueError: if sizes/dimensions of input or their elements are incorrect</span>
-</span><span id="concatenate_training_data-100"><a href="#concatenate_training_data-100"><span class="linenos">100</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="concatenate_training_data-101"><a href="#concatenate_training_data-101"><span class="linenos">101</span></a>  <span class="c1"># check input</span>
-</span><span id="concatenate_training_data-102"><a href="#concatenate_training_data-102"><span class="linenos">102</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">)</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span>
-</span><span id="concatenate_training_data-103"><a href="#concatenate_training_data-103"><span class="linenos">103</span></a>      <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="concatenate_training_data-104"><a href="#concatenate_training_data-104"><span class="linenos">104</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences and train_cluster_ids must be lists&#39;</span><span class="p">)</span>
-</span><span id="concatenate_training_data-105"><a href="#concatenate_training_data-105"><span class="linenos">105</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">):</span>
-</span><span id="concatenate_training_data-106"><a href="#concatenate_training_data-106"><span class="linenos">106</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="concatenate_training_data-107"><a href="#concatenate_training_data-107"><span class="linenos">107</span></a>        <span class="s1">&#39;train_sequences and train_cluster_ids must have same size&#39;</span><span class="p">)</span>
-</span><span id="concatenate_training_data-108"><a href="#concatenate_training_data-108"><span class="linenos">108</span></a>  <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="concatenate_training_data-109"><a href="#concatenate_training_data-109"><span class="linenos">109</span></a>      <span class="n">x</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span> <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="k">else</span> <span class="n">x</span>
-</span><span id="concatenate_training_data-110"><a href="#concatenate_training_data-110"><span class="linenos">110</span></a>      <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span><span class="p">]</span>
-</span><span id="concatenate_training_data-111"><a href="#concatenate_training_data-111"><span class="linenos">111</span></a>  <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="concatenate_training_data-112"><a href="#concatenate_training_data-112"><span class="linenos">112</span></a>  <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span>
-</span><span id="concatenate_training_data-113"><a href="#concatenate_training_data-113"><span class="linenos">113</span></a>      <span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">)):</span>
-</span><span id="concatenate_training_data-114"><a href="#concatenate_training_data-114"><span class="linenos">114</span></a>    <span class="n">train_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="concatenate_training_data-115"><a href="#concatenate_training_data-115"><span class="linenos">115</span></a>    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="concatenate_training_data-116"><a href="#concatenate_training_data-116"><span class="linenos">116</span></a>      <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="n">observation_dim</span>
-</span><span id="concatenate_training_data-117"><a href="#concatenate_training_data-117"><span class="linenos">117</span></a>    <span class="k">elif</span> <span class="n">global_observation_dim</span> <span class="o">!=</span> <span class="n">observation_dim</span><span class="p">:</span>
-</span><span id="concatenate_training_data-118"><a href="#concatenate_training_data-118"><span class="linenos">118</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="concatenate_training_data-119"><a href="#concatenate_training_data-119"><span class="linenos">119</span></a>          <span class="s1">&#39;train_sequences must have consistent observation dimension&#39;</span><span class="p">)</span>
-</span><span id="concatenate_training_data-120"><a href="#concatenate_training_data-120"><span class="linenos">120</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-</span><span id="concatenate_training_data-121"><a href="#concatenate_training_data-121"><span class="linenos">121</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span>
-</span><span id="concatenate_training_data-122"><a href="#concatenate_training_data-122"><span class="linenos">122</span></a>          <span class="s1">&#39;Elements of train_cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
-</span><span id="concatenate_training_data-123"><a href="#concatenate_training_data-123"><span class="linenos">123</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span> <span class="o">!=</span> <span class="n">train_length</span><span class="p">:</span>
-</span><span id="concatenate_training_data-124"><a href="#concatenate_training_data-124"><span class="linenos">124</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="concatenate_training_data-125"><a href="#concatenate_training_data-125"><span class="linenos">125</span></a>          <span class="s1">&#39;Each train_sequence and its train_cluster_id must have same length&#39;</span><span class="p">)</span>
-</span><span id="concatenate_training_data-126"><a href="#concatenate_training_data-126"><span class="linenos">126</span></a>
-</span><span id="concatenate_training_data-127"><a href="#concatenate_training_data-127"><span class="linenos">127</span></a>  <span class="c1"># enforce uniqueness</span>
-</span><span id="concatenate_training_data-128"><a href="#concatenate_training_data-128"><span class="linenos">128</span></a>  <span class="k">if</span> <span class="n">enforce_uniqueness</span><span class="p">:</span>
-</span><span id="concatenate_training_data-129"><a href="#concatenate_training_data-129"><span class="linenos">129</span></a>    <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="n">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">)</span>
-</span><span id="concatenate_training_data-130"><a href="#concatenate_training_data-130"><span class="linenos">130</span></a>
-</span><span id="concatenate_training_data-131"><a href="#concatenate_training_data-131"><span class="linenos">131</span></a>  <span class="c1"># random shuffle</span>
-</span><span id="concatenate_training_data-132"><a href="#concatenate_training_data-132"><span class="linenos">132</span></a>  <span class="k">if</span> <span class="n">shuffle</span><span class="p">:</span>
-</span><span id="concatenate_training_data-133"><a href="#concatenate_training_data-133"><span class="linenos">133</span></a>    <span class="n">zipped_input</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">))</span>
-</span><span id="concatenate_training_data-134"><a href="#concatenate_training_data-134"><span class="linenos">134</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">zipped_input</span><span class="p">)</span>
-</span><span id="concatenate_training_data-135"><a href="#concatenate_training_data-135"><span class="linenos">135</span></a>    <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">zipped_input</span><span class="p">)</span>
-</span><span id="concatenate_training_data-136"><a href="#concatenate_training_data-136"><span class="linenos">136</span></a>
-</span><span id="concatenate_training_data-137"><a href="#concatenate_training_data-137"><span class="linenos">137</span></a>  <span class="c1"># concatenate</span>
-</span><span id="concatenate_training_data-138"><a href="#concatenate_training_data-138"><span class="linenos">138</span></a>  <span class="n">concatenated_train_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="concatenate_training_data-139"><a href="#concatenate_training_data-139"><span class="linenos">139</span></a>  <span class="n">concatenated_train_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">train_cluster_id</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span>
-</span><span id="concatenate_training_data-140"><a href="#concatenate_training_data-140"><span class="linenos">140</span></a>                                   <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_id</span><span class="p">]</span>
-</span><span id="concatenate_training_data-141"><a href="#concatenate_training_data-141"><span class="linenos">141</span></a>  <span class="k">return</span> <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="concatenate_training_data-65"><a href="#concatenate_training_data-65"><span class="linenos"> 65</span></a><span class="k">def</span> <span class="nf">concatenate_training_data</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">,</span>
+</span><span id="concatenate_training_data-66"><a href="#concatenate_training_data-66"><span class="linenos"> 66</span></a>                              <span class="n">enforce_uniqueness</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+</span><span id="concatenate_training_data-67"><a href="#concatenate_training_data-67"><span class="linenos"> 67</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Concatenate training data.</span>
+</span><span id="concatenate_training_data-68"><a href="#concatenate_training_data-68"><span class="linenos"> 68</span></a>
+</span><span id="concatenate_training_data-69"><a href="#concatenate_training_data-69"><span class="linenos"> 69</span></a><span class="sd">  Args:</span>
+</span><span id="concatenate_training_data-70"><a href="#concatenate_training_data-70"><span class="linenos"> 70</span></a><span class="sd">    train_sequences: a list of 2-dim numpy arrays to be concatenated</span>
+</span><span id="concatenate_training_data-71"><a href="#concatenate_training_data-71"><span class="linenos"> 71</span></a><span class="sd">    train_cluster_ids: a list of 1-dim list/numpy.ndarray of strings</span>
+</span><span id="concatenate_training_data-72"><a href="#concatenate_training_data-72"><span class="linenos"> 72</span></a><span class="sd">    enforce_uniqueness: a boolean indicated whether we should enfore uniqueness</span>
+</span><span id="concatenate_training_data-73"><a href="#concatenate_training_data-73"><span class="linenos"> 73</span></a><span class="sd">      to train_cluster_ids</span>
+</span><span id="concatenate_training_data-74"><a href="#concatenate_training_data-74"><span class="linenos"> 74</span></a><span class="sd">    shuffle: whether to randomly shuffle input order</span>
+</span><span id="concatenate_training_data-75"><a href="#concatenate_training_data-75"><span class="linenos"> 75</span></a>
+</span><span id="concatenate_training_data-76"><a href="#concatenate_training_data-76"><span class="linenos"> 76</span></a><span class="sd">  Returns:</span>
+</span><span id="concatenate_training_data-77"><a href="#concatenate_training_data-77"><span class="linenos"> 77</span></a><span class="sd">    concatenated_train_sequence: a 2-dim numpy array</span>
+</span><span id="concatenate_training_data-78"><a href="#concatenate_training_data-78"><span class="linenos"> 78</span></a><span class="sd">    concatenated_train_cluster_id: a list of strings</span>
+</span><span id="concatenate_training_data-79"><a href="#concatenate_training_data-79"><span class="linenos"> 79</span></a>
+</span><span id="concatenate_training_data-80"><a href="#concatenate_training_data-80"><span class="linenos"> 80</span></a><span class="sd">  Raises:</span>
+</span><span id="concatenate_training_data-81"><a href="#concatenate_training_data-81"><span class="linenos"> 81</span></a><span class="sd">    TypeError: if input has wrong type</span>
+</span><span id="concatenate_training_data-82"><a href="#concatenate_training_data-82"><span class="linenos"> 82</span></a><span class="sd">    ValueError: if sizes/dimensions of input or their elements are incorrect</span>
+</span><span id="concatenate_training_data-83"><a href="#concatenate_training_data-83"><span class="linenos"> 83</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="concatenate_training_data-84"><a href="#concatenate_training_data-84"><span class="linenos"> 84</span></a>  <span class="c1"># check input</span>
+</span><span id="concatenate_training_data-85"><a href="#concatenate_training_data-85"><span class="linenos"> 85</span></a>  <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="nb">list</span><span class="p">)</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span>
+</span><span id="concatenate_training_data-86"><a href="#concatenate_training_data-86"><span class="linenos"> 86</span></a>      <span class="n">train_cluster_ids</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="concatenate_training_data-87"><a href="#concatenate_training_data-87"><span class="linenos"> 87</span></a>    <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s1">&#39;train_sequences and train_cluster_ids must be lists&#39;</span><span class="p">)</span>
+</span><span id="concatenate_training_data-88"><a href="#concatenate_training_data-88"><span class="linenos"> 88</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">):</span>
+</span><span id="concatenate_training_data-89"><a href="#concatenate_training_data-89"><span class="linenos"> 89</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="concatenate_training_data-90"><a href="#concatenate_training_data-90"><span class="linenos"> 90</span></a>        <span class="s1">&#39;train_sequences and train_cluster_ids must have same size&#39;</span><span class="p">)</span>
+</span><span id="concatenate_training_data-91"><a href="#concatenate_training_data-91"><span class="linenos"> 91</span></a>  <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="concatenate_training_data-92"><a href="#concatenate_training_data-92"><span class="linenos"> 92</span></a>      <span class="n">x</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span> <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)</span> <span class="k">else</span> <span class="n">x</span>
+</span><span id="concatenate_training_data-93"><a href="#concatenate_training_data-93"><span class="linenos"> 93</span></a>      <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span><span class="p">]</span>
+</span><span id="concatenate_training_data-94"><a href="#concatenate_training_data-94"><span class="linenos"> 94</span></a>  <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="concatenate_training_data-95"><a href="#concatenate_training_data-95"><span class="linenos"> 95</span></a>  <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="p">(</span><span class="n">train_sequence</span><span class="p">,</span> <span class="n">train_cluster_id</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span>
+</span><span id="concatenate_training_data-96"><a href="#concatenate_training_data-96"><span class="linenos"> 96</span></a>      <span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">)):</span>
+</span><span id="concatenate_training_data-97"><a href="#concatenate_training_data-97"><span class="linenos"> 97</span></a>    <span class="n">train_length</span><span class="p">,</span> <span class="n">observation_dim</span> <span class="o">=</span> <span class="n">train_sequence</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="concatenate_training_data-98"><a href="#concatenate_training_data-98"><span class="linenos"> 98</span></a>    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="concatenate_training_data-99"><a href="#concatenate_training_data-99"><span class="linenos"> 99</span></a>      <span class="n">global_observation_dim</span> <span class="o">=</span> <span class="n">observation_dim</span>
+</span><span id="concatenate_training_data-100"><a href="#concatenate_training_data-100"><span class="linenos">100</span></a>    <span class="k">elif</span> <span class="n">global_observation_dim</span> <span class="o">!=</span> <span class="n">observation_dim</span><span class="p">:</span>
+</span><span id="concatenate_training_data-101"><a href="#concatenate_training_data-101"><span class="linenos">101</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="concatenate_training_data-102"><a href="#concatenate_training_data-102"><span class="linenos">102</span></a>          <span class="s1">&#39;train_sequences must have consistent observation dimension&#39;</span><span class="p">)</span>
+</span><span id="concatenate_training_data-103"><a href="#concatenate_training_data-103"><span class="linenos">103</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+</span><span id="concatenate_training_data-104"><a href="#concatenate_training_data-104"><span class="linenos">104</span></a>      <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span>
+</span><span id="concatenate_training_data-105"><a href="#concatenate_training_data-105"><span class="linenos">105</span></a>          <span class="s1">&#39;Elements of train_cluster_ids must be list or numpy.ndarray&#39;</span><span class="p">)</span>
+</span><span id="concatenate_training_data-106"><a href="#concatenate_training_data-106"><span class="linenos">106</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_cluster_id</span><span class="p">)</span> <span class="o">!=</span> <span class="n">train_length</span><span class="p">:</span>
+</span><span id="concatenate_training_data-107"><a href="#concatenate_training_data-107"><span class="linenos">107</span></a>      <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="concatenate_training_data-108"><a href="#concatenate_training_data-108"><span class="linenos">108</span></a>          <span class="s1">&#39;Each train_sequence and its train_cluster_id must have same length&#39;</span><span class="p">)</span>
+</span><span id="concatenate_training_data-109"><a href="#concatenate_training_data-109"><span class="linenos">109</span></a>
+</span><span id="concatenate_training_data-110"><a href="#concatenate_training_data-110"><span class="linenos">110</span></a>  <span class="c1"># enforce uniqueness</span>
+</span><span id="concatenate_training_data-111"><a href="#concatenate_training_data-111"><span class="linenos">111</span></a>  <span class="k">if</span> <span class="n">enforce_uniqueness</span><span class="p">:</span>
+</span><span id="concatenate_training_data-112"><a href="#concatenate_training_data-112"><span class="linenos">112</span></a>    <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="n">enforce_cluster_id_uniqueness</span><span class="p">(</span><span class="n">train_cluster_ids</span><span class="p">)</span>
+</span><span id="concatenate_training_data-113"><a href="#concatenate_training_data-113"><span class="linenos">113</span></a>
+</span><span id="concatenate_training_data-114"><a href="#concatenate_training_data-114"><span class="linenos">114</span></a>  <span class="c1"># random shuffle</span>
+</span><span id="concatenate_training_data-115"><a href="#concatenate_training_data-115"><span class="linenos">115</span></a>  <span class="k">if</span> <span class="n">shuffle</span><span class="p">:</span>
+</span><span id="concatenate_training_data-116"><a href="#concatenate_training_data-116"><span class="linenos">116</span></a>    <span class="n">zipped_input</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span><span class="p">))</span>
+</span><span id="concatenate_training_data-117"><a href="#concatenate_training_data-117"><span class="linenos">117</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">zipped_input</span><span class="p">)</span>
+</span><span id="concatenate_training_data-118"><a href="#concatenate_training_data-118"><span class="linenos">118</span></a>    <span class="n">train_sequences</span><span class="p">,</span> <span class="n">train_cluster_ids</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">zipped_input</span><span class="p">)</span>
+</span><span id="concatenate_training_data-119"><a href="#concatenate_training_data-119"><span class="linenos">119</span></a>
+</span><span id="concatenate_training_data-120"><a href="#concatenate_training_data-120"><span class="linenos">120</span></a>  <span class="c1"># concatenate</span>
+</span><span id="concatenate_training_data-121"><a href="#concatenate_training_data-121"><span class="linenos">121</span></a>  <span class="n">concatenated_train_sequence</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">train_sequences</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="concatenate_training_data-122"><a href="#concatenate_training_data-122"><span class="linenos">122</span></a>  <span class="n">concatenated_train_cluster_id</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">train_cluster_id</span> <span class="ow">in</span> <span class="n">train_cluster_ids</span>
+</span><span id="concatenate_training_data-123"><a href="#concatenate_training_data-123"><span class="linenos">123</span></a>                                   <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">train_cluster_id</span><span class="p">]</span>
+</span><span id="concatenate_training_data-124"><a href="#concatenate_training_data-124"><span class="linenos">124</span></a>  <span class="k">return</span> <span class="n">concatenated_train_sequence</span><span class="p">,</span> <span class="n">concatenated_train_cluster_id</span>
 </span></pre></div>
 
 
@@ -701,50 +588,50 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#sample_permuted_segments"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="sample_permuted_segments-144"><a href="#sample_permuted_segments-144"><span class="linenos">144</span></a><span class="k">def</span> <span class="nf">sample_permuted_segments</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">,</span> <span class="n">number_samples</span><span class="p">):</span>
-</span><span id="sample_permuted_segments-145"><a href="#sample_permuted_segments-145"><span class="linenos">145</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Sample sequences with permuted blocks.</span>
-</span><span id="sample_permuted_segments-146"><a href="#sample_permuted_segments-146"><span class="linenos">146</span></a>
-</span><span id="sample_permuted_segments-147"><a href="#sample_permuted_segments-147"><span class="linenos">147</span></a><span class="sd">  Args:</span>
-</span><span id="sample_permuted_segments-148"><a href="#sample_permuted_segments-148"><span class="linenos">148</span></a><span class="sd">    index_sequence: (integer array, size: L)</span>
-</span><span id="sample_permuted_segments-149"><a href="#sample_permuted_segments-149"><span class="linenos">149</span></a><span class="sd">      - subsequence index</span>
-</span><span id="sample_permuted_segments-150"><a href="#sample_permuted_segments-150"><span class="linenos">150</span></a><span class="sd">      For example, index_sequence = [1,2,6,10,11,12].</span>
-</span><span id="sample_permuted_segments-151"><a href="#sample_permuted_segments-151"><span class="linenos">151</span></a><span class="sd">    number_samples: (integer)</span>
-</span><span id="sample_permuted_segments-152"><a href="#sample_permuted_segments-152"><span class="linenos">152</span></a><span class="sd">      - number of subsampled block-preserving permuted sequences.</span>
-</span><span id="sample_permuted_segments-153"><a href="#sample_permuted_segments-153"><span class="linenos">153</span></a><span class="sd">      For example, number_samples = 5</span>
-</span><span id="sample_permuted_segments-154"><a href="#sample_permuted_segments-154"><span class="linenos">154</span></a>
-</span><span id="sample_permuted_segments-155"><a href="#sample_permuted_segments-155"><span class="linenos">155</span></a><span class="sd">  Returns:</span>
-</span><span id="sample_permuted_segments-156"><a href="#sample_permuted_segments-156"><span class="linenos">156</span></a><span class="sd">    sampled_index_sequences: (a list of numpy arrays) - a list of subsampled</span>
-</span><span id="sample_permuted_segments-157"><a href="#sample_permuted_segments-157"><span class="linenos">157</span></a><span class="sd">      block-preserving permuted sequences. For example,</span>
-</span><span id="sample_permuted_segments-158"><a href="#sample_permuted_segments-158"><span class="linenos">158</span></a><span class="sd">    ```</span>
-</span><span id="sample_permuted_segments-159"><a href="#sample_permuted_segments-159"><span class="linenos">159</span></a><span class="sd">    sampled_index_sequences =</span>
-</span><span id="sample_permuted_segments-160"><a href="#sample_permuted_segments-160"><span class="linenos">160</span></a><span class="sd">    [[10,11,12,1,2,6],</span>
-</span><span id="sample_permuted_segments-161"><a href="#sample_permuted_segments-161"><span class="linenos">161</span></a><span class="sd">     [6,1,2,10,11,12],</span>
-</span><span id="sample_permuted_segments-162"><a href="#sample_permuted_segments-162"><span class="linenos">162</span></a><span class="sd">     [1,2,10,11,12,6],</span>
-</span><span id="sample_permuted_segments-163"><a href="#sample_permuted_segments-163"><span class="linenos">163</span></a><span class="sd">     [6,1,2,10,11,12],</span>
-</span><span id="sample_permuted_segments-164"><a href="#sample_permuted_segments-164"><span class="linenos">164</span></a><span class="sd">     [1,2,6,10,11,12]]</span>
-</span><span id="sample_permuted_segments-165"><a href="#sample_permuted_segments-165"><span class="linenos">165</span></a><span class="sd">    ```</span>
-</span><span id="sample_permuted_segments-166"><a href="#sample_permuted_segments-166"><span class="linenos">166</span></a><span class="sd">      The length of &quot;sampled_index_sequences&quot; is &quot;number_samples&quot;.</span>
-</span><span id="sample_permuted_segments-167"><a href="#sample_permuted_segments-167"><span class="linenos">167</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="sample_permuted_segments-168"><a href="#sample_permuted_segments-168"><span class="linenos">168</span></a>  <span class="n">segments</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="sample_permuted_segments-169"><a href="#sample_permuted_segments-169"><span class="linenos">169</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="sample_permuted_segments-170"><a href="#sample_permuted_segments-170"><span class="linenos">170</span></a>    <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span>
-</span><span id="sample_permuted_segments-171"><a href="#sample_permuted_segments-171"><span class="linenos">171</span></a>  <span class="k">else</span><span class="p">:</span>
-</span><span id="sample_permuted_segments-172"><a href="#sample_permuted_segments-172"><span class="linenos">172</span></a>    <span class="n">prev</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="sample_permuted_segments-173"><a href="#sample_permuted_segments-173"><span class="linenos">173</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="sample_permuted_segments-174"><a href="#sample_permuted_segments-174"><span class="linenos">174</span></a>      <span class="k">if</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">]</span> <span class="o">!=</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="sample_permuted_segments-175"><a href="#sample_permuted_segments-175"><span class="linenos">175</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)])</span>
-</span><span id="sample_permuted_segments-176"><a href="#sample_permuted_segments-176"><span class="linenos">176</span></a>        <span class="n">prev</span> <span class="o">=</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span>
-</span><span id="sample_permuted_segments-177"><a href="#sample_permuted_segments-177"><span class="linenos">177</span></a>      <span class="k">if</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="sample_permuted_segments-178"><a href="#sample_permuted_segments-178"><span class="linenos">178</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:])</span>
-</span><span id="sample_permuted_segments-179"><a href="#sample_permuted_segments-179"><span class="linenos">179</span></a>  <span class="c1"># sample permutations</span>
-</span><span id="sample_permuted_segments-180"><a href="#sample_permuted_segments-180"><span class="linenos">180</span></a>  <span class="n">sampled_index_sequences</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="sample_permuted_segments-181"><a href="#sample_permuted_segments-181"><span class="linenos">181</span></a>  <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">number_samples</span><span class="p">):</span>
-</span><span id="sample_permuted_segments-182"><a href="#sample_permuted_segments-182"><span class="linenos">182</span></a>    <span class="n">segments_array</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="sample_permuted_segments-183"><a href="#sample_permuted_segments-183"><span class="linenos">183</span></a>    <span class="n">permutation</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">permutation</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">segments</span><span class="p">))</span>
-</span><span id="sample_permuted_segments-184"><a href="#sample_permuted_segments-184"><span class="linenos">184</span></a>    <span class="k">for</span> <span class="n">permutation_item</span> <span class="ow">in</span> <span class="n">permutation</span><span class="p">:</span>
-</span><span id="sample_permuted_segments-185"><a href="#sample_permuted_segments-185"><span class="linenos">185</span></a>      <span class="n">segments_array</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">segments</span><span class="p">[</span><span class="n">permutation_item</span><span class="p">])</span>
-</span><span id="sample_permuted_segments-186"><a href="#sample_permuted_segments-186"><span class="linenos">186</span></a>    <span class="n">sampled_index_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">segments_array</span><span class="p">))</span>
-</span><span id="sample_permuted_segments-187"><a href="#sample_permuted_segments-187"><span class="linenos">187</span></a>  <span class="k">return</span> <span class="n">sampled_index_sequences</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="sample_permuted_segments-127"><a href="#sample_permuted_segments-127"><span class="linenos">127</span></a><span class="k">def</span> <span class="nf">sample_permuted_segments</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">,</span> <span class="n">number_samples</span><span class="p">):</span>
+</span><span id="sample_permuted_segments-128"><a href="#sample_permuted_segments-128"><span class="linenos">128</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Sample sequences with permuted blocks.</span>
+</span><span id="sample_permuted_segments-129"><a href="#sample_permuted_segments-129"><span class="linenos">129</span></a>
+</span><span id="sample_permuted_segments-130"><a href="#sample_permuted_segments-130"><span class="linenos">130</span></a><span class="sd">  Args:</span>
+</span><span id="sample_permuted_segments-131"><a href="#sample_permuted_segments-131"><span class="linenos">131</span></a><span class="sd">    index_sequence: (integer array, size: L)</span>
+</span><span id="sample_permuted_segments-132"><a href="#sample_permuted_segments-132"><span class="linenos">132</span></a><span class="sd">      - subsequence index</span>
+</span><span id="sample_permuted_segments-133"><a href="#sample_permuted_segments-133"><span class="linenos">133</span></a><span class="sd">      For example, index_sequence = [1,2,6,10,11,12].</span>
+</span><span id="sample_permuted_segments-134"><a href="#sample_permuted_segments-134"><span class="linenos">134</span></a><span class="sd">    number_samples: (integer)</span>
+</span><span id="sample_permuted_segments-135"><a href="#sample_permuted_segments-135"><span class="linenos">135</span></a><span class="sd">      - number of subsampled block-preserving permuted sequences.</span>
+</span><span id="sample_permuted_segments-136"><a href="#sample_permuted_segments-136"><span class="linenos">136</span></a><span class="sd">      For example, number_samples = 5</span>
+</span><span id="sample_permuted_segments-137"><a href="#sample_permuted_segments-137"><span class="linenos">137</span></a>
+</span><span id="sample_permuted_segments-138"><a href="#sample_permuted_segments-138"><span class="linenos">138</span></a><span class="sd">  Returns:</span>
+</span><span id="sample_permuted_segments-139"><a href="#sample_permuted_segments-139"><span class="linenos">139</span></a><span class="sd">    sampled_index_sequences: (a list of numpy arrays) - a list of subsampled</span>
+</span><span id="sample_permuted_segments-140"><a href="#sample_permuted_segments-140"><span class="linenos">140</span></a><span class="sd">      block-preserving permuted sequences. For example,</span>
+</span><span id="sample_permuted_segments-141"><a href="#sample_permuted_segments-141"><span class="linenos">141</span></a><span class="sd">    ```</span>
+</span><span id="sample_permuted_segments-142"><a href="#sample_permuted_segments-142"><span class="linenos">142</span></a><span class="sd">    sampled_index_sequences =</span>
+</span><span id="sample_permuted_segments-143"><a href="#sample_permuted_segments-143"><span class="linenos">143</span></a><span class="sd">    [[10,11,12,1,2,6],</span>
+</span><span id="sample_permuted_segments-144"><a href="#sample_permuted_segments-144"><span class="linenos">144</span></a><span class="sd">     [6,1,2,10,11,12],</span>
+</span><span id="sample_permuted_segments-145"><a href="#sample_permuted_segments-145"><span class="linenos">145</span></a><span class="sd">     [1,2,10,11,12,6],</span>
+</span><span id="sample_permuted_segments-146"><a href="#sample_permuted_segments-146"><span class="linenos">146</span></a><span class="sd">     [6,1,2,10,11,12],</span>
+</span><span id="sample_permuted_segments-147"><a href="#sample_permuted_segments-147"><span class="linenos">147</span></a><span class="sd">     [1,2,6,10,11,12]]</span>
+</span><span id="sample_permuted_segments-148"><a href="#sample_permuted_segments-148"><span class="linenos">148</span></a><span class="sd">    ```</span>
+</span><span id="sample_permuted_segments-149"><a href="#sample_permuted_segments-149"><span class="linenos">149</span></a><span class="sd">      The length of &quot;sampled_index_sequences&quot; is &quot;number_samples&quot;.</span>
+</span><span id="sample_permuted_segments-150"><a href="#sample_permuted_segments-150"><span class="linenos">150</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="sample_permuted_segments-151"><a href="#sample_permuted_segments-151"><span class="linenos">151</span></a>  <span class="n">segments</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="sample_permuted_segments-152"><a href="#sample_permuted_segments-152"><span class="linenos">152</span></a>  <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="sample_permuted_segments-153"><a href="#sample_permuted_segments-153"><span class="linenos">153</span></a>    <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span>
+</span><span id="sample_permuted_segments-154"><a href="#sample_permuted_segments-154"><span class="linenos">154</span></a>  <span class="k">else</span><span class="p">:</span>
+</span><span id="sample_permuted_segments-155"><a href="#sample_permuted_segments-155"><span class="linenos">155</span></a>    <span class="n">prev</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="sample_permuted_segments-156"><a href="#sample_permuted_segments-156"><span class="linenos">156</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="sample_permuted_segments-157"><a href="#sample_permuted_segments-157"><span class="linenos">157</span></a>      <span class="k">if</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">]</span> <span class="o">!=</span> <span class="n">index_sequence</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="sample_permuted_segments-158"><a href="#sample_permuted_segments-158"><span class="linenos">158</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)])</span>
+</span><span id="sample_permuted_segments-159"><a href="#sample_permuted_segments-159"><span class="linenos">159</span></a>        <span class="n">prev</span> <span class="o">=</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span>
+</span><span id="sample_permuted_segments-160"><a href="#sample_permuted_segments-160"><span class="linenos">160</span></a>      <span class="k">if</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="sample_permuted_segments-161"><a href="#sample_permuted_segments-161"><span class="linenos">161</span></a>        <span class="n">segments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">index_sequence</span><span class="p">[</span><span class="n">prev</span><span class="p">:])</span>
+</span><span id="sample_permuted_segments-162"><a href="#sample_permuted_segments-162"><span class="linenos">162</span></a>  <span class="c1"># sample permutations</span>
+</span><span id="sample_permuted_segments-163"><a href="#sample_permuted_segments-163"><span class="linenos">163</span></a>  <span class="n">sampled_index_sequences</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="sample_permuted_segments-164"><a href="#sample_permuted_segments-164"><span class="linenos">164</span></a>  <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">number_samples</span><span class="p">):</span>
+</span><span id="sample_permuted_segments-165"><a href="#sample_permuted_segments-165"><span class="linenos">165</span></a>    <span class="n">segments_array</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="sample_permuted_segments-166"><a href="#sample_permuted_segments-166"><span class="linenos">166</span></a>    <span class="n">permutation</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">permutation</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">segments</span><span class="p">))</span>
+</span><span id="sample_permuted_segments-167"><a href="#sample_permuted_segments-167"><span class="linenos">167</span></a>    <span class="k">for</span> <span class="n">permutation_item</span> <span class="ow">in</span> <span class="n">permutation</span><span class="p">:</span>
+</span><span id="sample_permuted_segments-168"><a href="#sample_permuted_segments-168"><span class="linenos">168</span></a>      <span class="n">segments_array</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">segments</span><span class="p">[</span><span class="n">permutation_item</span><span class="p">])</span>
+</span><span id="sample_permuted_segments-169"><a href="#sample_permuted_segments-169"><span class="linenos">169</span></a>    <span class="n">sampled_index_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">segments_array</span><span class="p">))</span>
+</span><span id="sample_permuted_segments-170"><a href="#sample_permuted_segments-170"><span class="linenos">170</span></a>  <span class="k">return</span> <span class="n">sampled_index_sequences</span>
 </span></pre></div>
 
 
@@ -760,15 +647,18 @@ <h1 class="modulename">
 
 <p>Returns:
   sampled_index_sequences: (a list of numpy arrays) - a list of subsampled
-    block-preserving permuted sequences. For example,
-  <pre><code>sampled_index_sequences =
+    block-preserving permuted sequences. For example,</p>
+
+<p><pre><code>sampled_index_sequences =
 [[10,11,12,1,2,6],
  [6,1,2,10,11,12],
  [1,2,10,11,12,6],
  [6,1,2,10,11,12],
  [1,2,6,10,11,12]]
+</code></pre></p>
+
+<pre><code>The length of "sampled_index_sequences" is "number_samples".
 </code></pre>
-    The length of "sampled_index_sequences" is "number_samples".</p>
 </div>
 
 
@@ -784,36 +674,36 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#resize_sequence"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="resize_sequence-190"><a href="#resize_sequence-190"><span class="linenos">190</span></a><span class="k">def</span> <span class="nf">resize_sequence</span><span class="p">(</span><span class="n">sequence</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">,</span> <span class="n">num_permutations</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-</span><span id="resize_sequence-191"><a href="#resize_sequence-191"><span class="linenos">191</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Resize sequences for packing and batching.</span>
-</span><span id="resize_sequence-192"><a href="#resize_sequence-192"><span class="linenos">192</span></a>
-</span><span id="resize_sequence-193"><a href="#resize_sequence-193"><span class="linenos">193</span></a><span class="sd">  Args:</span>
-</span><span id="resize_sequence-194"><a href="#resize_sequence-194"><span class="linenos">194</span></a><span class="sd">    sequence: (real numpy matrix, size: seq_len*obs_size) - observed sequence</span>
-</span><span id="resize_sequence-195"><a href="#resize_sequence-195"><span class="linenos">195</span></a><span class="sd">    cluster_id: (numpy vector, size: seq_len) - cluster indicator sequence</span>
-</span><span id="resize_sequence-196"><a href="#resize_sequence-196"><span class="linenos">196</span></a><span class="sd">    num_permutations: int - Number of permutations per utterance sampled.</span>
-</span><span id="resize_sequence-197"><a href="#resize_sequence-197"><span class="linenos">197</span></a>
-</span><span id="resize_sequence-198"><a href="#resize_sequence-198"><span class="linenos">198</span></a><span class="sd">  Returns:</span>
-</span><span id="resize_sequence-199"><a href="#resize_sequence-199"><span class="linenos">199</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
-</span><span id="resize_sequence-200"><a href="#resize_sequence-200"><span class="linenos">200</span></a><span class="sd">      cluster in the same list.</span>
-</span><span id="resize_sequence-201"><a href="#resize_sequence-201"><span class="linenos">201</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
-</span><span id="resize_sequence-202"><a href="#resize_sequence-202"><span class="linenos">202</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="resize_sequence-203"><a href="#resize_sequence-203"><span class="linenos">203</span></a>  <span class="c1"># merge sub-sequences that belong to a single cluster to a single sequence</span>
-</span><span id="resize_sequence-204"><a href="#resize_sequence-204"><span class="linenos">204</span></a>  <span class="n">unique_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">)</span>
-</span><span id="resize_sequence-205"><a href="#resize_sequence-205"><span class="linenos">205</span></a>  <span class="n">sub_sequences</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="resize_sequence-206"><a href="#resize_sequence-206"><span class="linenos">206</span></a>  <span class="n">seq_lengths</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="resize_sequence-207"><a href="#resize_sequence-207"><span class="linenos">207</span></a>  <span class="k">if</span> <span class="n">num_permutations</span> <span class="ow">and</span> <span class="n">num_permutations</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="resize_sequence-208"><a href="#resize_sequence-208"><span class="linenos">208</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
-</span><span id="resize_sequence-209"><a href="#resize_sequence-209"><span class="linenos">209</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="resize_sequence-210"><a href="#resize_sequence-210"><span class="linenos">210</span></a>      <span class="n">sampled_idx_sets</span> <span class="o">=</span> <span class="n">sample_permuted_segments</span><span class="p">(</span><span class="n">idx_set</span><span class="p">,</span> <span class="n">num_permutations</span><span class="p">)</span>
-</span><span id="resize_sequence-211"><a href="#resize_sequence-211"><span class="linenos">211</span></a>      <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_permutations</span><span class="p">):</span>
-</span><span id="resize_sequence-212"><a href="#resize_sequence-212"><span class="linenos">212</span></a>        <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">sampled_idx_sets</span><span class="p">[</span><span class="n">j</span><span class="p">],</span> <span class="p">:])</span>
-</span><span id="resize_sequence-213"><a href="#resize_sequence-213"><span class="linenos">213</span></a>        <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="resize_sequence-214"><a href="#resize_sequence-214"><span class="linenos">214</span></a>  <span class="k">else</span><span class="p">:</span>
-</span><span id="resize_sequence-215"><a href="#resize_sequence-215"><span class="linenos">215</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
-</span><span id="resize_sequence-216"><a href="#resize_sequence-216"><span class="linenos">216</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
-</span><span id="resize_sequence-217"><a href="#resize_sequence-217"><span class="linenos">217</span></a>      <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">idx_set</span><span class="p">,</span> <span class="p">:][</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="resize_sequence-218"><a href="#resize_sequence-218"><span class="linenos">218</span></a>      <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="resize_sequence-219"><a href="#resize_sequence-219"><span class="linenos">219</span></a>  <span class="k">return</span> <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="resize_sequence-173"><a href="#resize_sequence-173"><span class="linenos">173</span></a><span class="k">def</span> <span class="nf">resize_sequence</span><span class="p">(</span><span class="n">sequence</span><span class="p">,</span> <span class="n">cluster_id</span><span class="p">,</span> <span class="n">num_permutations</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="resize_sequence-174"><a href="#resize_sequence-174"><span class="linenos">174</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Resize sequences for packing and batching.</span>
+</span><span id="resize_sequence-175"><a href="#resize_sequence-175"><span class="linenos">175</span></a>
+</span><span id="resize_sequence-176"><a href="#resize_sequence-176"><span class="linenos">176</span></a><span class="sd">  Args:</span>
+</span><span id="resize_sequence-177"><a href="#resize_sequence-177"><span class="linenos">177</span></a><span class="sd">    sequence: (real numpy matrix, size: seq_len*obs_size) - observed sequence</span>
+</span><span id="resize_sequence-178"><a href="#resize_sequence-178"><span class="linenos">178</span></a><span class="sd">    cluster_id: (numpy vector, size: seq_len) - cluster indicator sequence</span>
+</span><span id="resize_sequence-179"><a href="#resize_sequence-179"><span class="linenos">179</span></a><span class="sd">    num_permutations: int - Number of permutations per utterance sampled.</span>
+</span><span id="resize_sequence-180"><a href="#resize_sequence-180"><span class="linenos">180</span></a>
+</span><span id="resize_sequence-181"><a href="#resize_sequence-181"><span class="linenos">181</span></a><span class="sd">  Returns:</span>
+</span><span id="resize_sequence-182"><a href="#resize_sequence-182"><span class="linenos">182</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
+</span><span id="resize_sequence-183"><a href="#resize_sequence-183"><span class="linenos">183</span></a><span class="sd">      cluster in the same list.</span>
+</span><span id="resize_sequence-184"><a href="#resize_sequence-184"><span class="linenos">184</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
+</span><span id="resize_sequence-185"><a href="#resize_sequence-185"><span class="linenos">185</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="resize_sequence-186"><a href="#resize_sequence-186"><span class="linenos">186</span></a>  <span class="c1"># merge sub-sequences that belong to a single cluster to a single sequence</span>
+</span><span id="resize_sequence-187"><a href="#resize_sequence-187"><span class="linenos">187</span></a>  <span class="n">unique_id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">cluster_id</span><span class="p">)</span>
+</span><span id="resize_sequence-188"><a href="#resize_sequence-188"><span class="linenos">188</span></a>  <span class="n">sub_sequences</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="resize_sequence-189"><a href="#resize_sequence-189"><span class="linenos">189</span></a>  <span class="n">seq_lengths</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="resize_sequence-190"><a href="#resize_sequence-190"><span class="linenos">190</span></a>  <span class="k">if</span> <span class="n">num_permutations</span> <span class="ow">and</span> <span class="n">num_permutations</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="resize_sequence-191"><a href="#resize_sequence-191"><span class="linenos">191</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
+</span><span id="resize_sequence-192"><a href="#resize_sequence-192"><span class="linenos">192</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="resize_sequence-193"><a href="#resize_sequence-193"><span class="linenos">193</span></a>      <span class="n">sampled_idx_sets</span> <span class="o">=</span> <span class="n">sample_permuted_segments</span><span class="p">(</span><span class="n">idx_set</span><span class="p">,</span> <span class="n">num_permutations</span><span class="p">)</span>
+</span><span id="resize_sequence-194"><a href="#resize_sequence-194"><span class="linenos">194</span></a>      <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_permutations</span><span class="p">):</span>
+</span><span id="resize_sequence-195"><a href="#resize_sequence-195"><span class="linenos">195</span></a>        <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">sampled_idx_sets</span><span class="p">[</span><span class="n">j</span><span class="p">],</span> <span class="p">:])</span>
+</span><span id="resize_sequence-196"><a href="#resize_sequence-196"><span class="linenos">196</span></a>        <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="resize_sequence-197"><a href="#resize_sequence-197"><span class="linenos">197</span></a>  <span class="k">else</span><span class="p">:</span>
+</span><span id="resize_sequence-198"><a href="#resize_sequence-198"><span class="linenos">198</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">unique_id</span><span class="p">:</span>
+</span><span id="resize_sequence-199"><a href="#resize_sequence-199"><span class="linenos">199</span></a>      <span class="n">idx_set</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_id</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
+</span><span id="resize_sequence-200"><a href="#resize_sequence-200"><span class="linenos">200</span></a>      <span class="n">sub_sequences</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sequence</span><span class="p">[</span><span class="n">idx_set</span><span class="p">,</span> <span class="p">:][</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="resize_sequence-201"><a href="#resize_sequence-201"><span class="linenos">201</span></a>      <span class="n">seq_lengths</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">idx_set</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="resize_sequence-202"><a href="#resize_sequence-202"><span class="linenos">202</span></a>  <span class="k">return</span> <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span>
 </span></pre></div>
 
 
@@ -843,53 +733,53 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#pack_sequence"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="pack_sequence-222"><a href="#pack_sequence-222"><span class="linenos">222</span></a><span class="k">def</span> <span class="nf">pack_sequence</span><span class="p">(</span>
-</span><span id="pack_sequence-223"><a href="#pack_sequence-223"><span class="linenos">223</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">device</span><span class="p">):</span>
-</span><span id="pack_sequence-224"><a href="#pack_sequence-224"><span class="linenos">224</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Pack sequences for training.</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="pack_sequence-205"><a href="#pack_sequence-205"><span class="linenos">205</span></a><span class="k">def</span> <span class="nf">pack_sequence</span><span class="p">(</span>
+</span><span id="pack_sequence-206"><a href="#pack_sequence-206"><span class="linenos">206</span></a>    <span class="n">sub_sequences</span><span class="p">,</span> <span class="n">seq_lengths</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">,</span> <span class="n">observation_dim</span><span class="p">,</span> <span class="n">device</span><span class="p">):</span>
+</span><span id="pack_sequence-207"><a href="#pack_sequence-207"><span class="linenos">207</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Pack sequences for training.</span>
+</span><span id="pack_sequence-208"><a href="#pack_sequence-208"><span class="linenos">208</span></a>
+</span><span id="pack_sequence-209"><a href="#pack_sequence-209"><span class="linenos">209</span></a><span class="sd">  Args:</span>
+</span><span id="pack_sequence-210"><a href="#pack_sequence-210"><span class="linenos">210</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
+</span><span id="pack_sequence-211"><a href="#pack_sequence-211"><span class="linenos">211</span></a><span class="sd">      cluster in the same list.</span>
+</span><span id="pack_sequence-212"><a href="#pack_sequence-212"><span class="linenos">212</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
+</span><span id="pack_sequence-213"><a href="#pack_sequence-213"><span class="linenos">213</span></a><span class="sd">    batch_size: int or None - Run batch learning if batch_size is None. Else,</span>
+</span><span id="pack_sequence-214"><a href="#pack_sequence-214"><span class="linenos">214</span></a><span class="sd">      run online learning with specified batch size.</span>
+</span><span id="pack_sequence-215"><a href="#pack_sequence-215"><span class="linenos">215</span></a><span class="sd">    observation_dim: int - dimension for observation vectors</span>
+</span><span id="pack_sequence-216"><a href="#pack_sequence-216"><span class="linenos">216</span></a><span class="sd">    device: str - Your device. E.g., `cuda:0` or `cpu`.</span>
+</span><span id="pack_sequence-217"><a href="#pack_sequence-217"><span class="linenos">217</span></a>
+</span><span id="pack_sequence-218"><a href="#pack_sequence-218"><span class="linenos">218</span></a><span class="sd">  Returns:</span>
+</span><span id="pack_sequence-219"><a href="#pack_sequence-219"><span class="linenos">219</span></a><span class="sd">    packed_rnn_input: (PackedSequence object) packed rnn input</span>
+</span><span id="pack_sequence-220"><a href="#pack_sequence-220"><span class="linenos">220</span></a><span class="sd">    rnn_truth: ground truth</span>
+</span><span id="pack_sequence-221"><a href="#pack_sequence-221"><span class="linenos">221</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="pack_sequence-222"><a href="#pack_sequence-222"><span class="linenos">222</span></a>  <span class="n">num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)</span>
+</span><span id="pack_sequence-223"><a href="#pack_sequence-223"><span class="linenos">223</span></a>  <span class="n">sorted_seq_lengths</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="pack_sequence-224"><a href="#pack_sequence-224"><span class="linenos">224</span></a>  <span class="n">permute_index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
 </span><span id="pack_sequence-225"><a href="#pack_sequence-225"><span class="linenos">225</span></a>
-</span><span id="pack_sequence-226"><a href="#pack_sequence-226"><span class="linenos">226</span></a><span class="sd">  Args:</span>
-</span><span id="pack_sequence-227"><a href="#pack_sequence-227"><span class="linenos">227</span></a><span class="sd">    sub_sequences: A list of numpy array, with obsevation vector from the same</span>
-</span><span id="pack_sequence-228"><a href="#pack_sequence-228"><span class="linenos">228</span></a><span class="sd">      cluster in the same list.</span>
-</span><span id="pack_sequence-229"><a href="#pack_sequence-229"><span class="linenos">229</span></a><span class="sd">    seq_lengths: The length of each cluster (+1).</span>
-</span><span id="pack_sequence-230"><a href="#pack_sequence-230"><span class="linenos">230</span></a><span class="sd">    batch_size: int or None - Run batch learning if batch_size is None. Else,</span>
-</span><span id="pack_sequence-231"><a href="#pack_sequence-231"><span class="linenos">231</span></a><span class="sd">      run online learning with specified batch size.</span>
-</span><span id="pack_sequence-232"><a href="#pack_sequence-232"><span class="linenos">232</span></a><span class="sd">    observation_dim: int - dimension for observation vectors</span>
-</span><span id="pack_sequence-233"><a href="#pack_sequence-233"><span class="linenos">233</span></a><span class="sd">    device: str - Your device. E.g., `cuda:0` or `cpu`.</span>
-</span><span id="pack_sequence-234"><a href="#pack_sequence-234"><span class="linenos">234</span></a>
-</span><span id="pack_sequence-235"><a href="#pack_sequence-235"><span class="linenos">235</span></a><span class="sd">  Returns:</span>
-</span><span id="pack_sequence-236"><a href="#pack_sequence-236"><span class="linenos">236</span></a><span class="sd">    packed_rnn_input: (PackedSequence object) packed rnn input</span>
-</span><span id="pack_sequence-237"><a href="#pack_sequence-237"><span class="linenos">237</span></a><span class="sd">    rnn_truth: ground truth</span>
-</span><span id="pack_sequence-238"><a href="#pack_sequence-238"><span class="linenos">238</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="pack_sequence-239"><a href="#pack_sequence-239"><span class="linenos">239</span></a>  <span class="n">num_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)</span>
-</span><span id="pack_sequence-240"><a href="#pack_sequence-240"><span class="linenos">240</span></a>  <span class="n">sorted_seq_lengths</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="pack_sequence-241"><a href="#pack_sequence-241"><span class="linenos">241</span></a>  <span class="n">permute_index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">seq_lengths</span><span class="p">)[::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="pack_sequence-242"><a href="#pack_sequence-242"><span class="linenos">242</span></a>
-</span><span id="pack_sequence-243"><a href="#pack_sequence-243"><span class="linenos">243</span></a>  <span class="k">if</span> <span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="pack_sequence-244"><a href="#pack_sequence-244"><span class="linenos">244</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
-</span><span id="pack_sequence-245"><a href="#pack_sequence-245"><span class="linenos">245</span></a>                          <span class="n">num_clusters</span><span class="p">,</span>
-</span><span id="pack_sequence-246"><a href="#pack_sequence-246"><span class="linenos">246</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
-</span><span id="pack_sequence-247"><a href="#pack_sequence-247"><span class="linenos">247</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">):</span>
-</span><span id="pack_sequence-248"><a href="#pack_sequence-248"><span class="linenos">248</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">i</span><span class="p">,</span>
-</span><span id="pack_sequence-249"><a href="#pack_sequence-249"><span class="linenos">249</span></a>                <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
-</span><span id="pack_sequence-250"><a href="#pack_sequence-250"><span class="linenos">250</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="pack_sequence-251"><a href="#pack_sequence-251"><span class="linenos">251</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
-</span><span id="pack_sequence-252"><a href="#pack_sequence-252"><span class="linenos">252</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
-</span><span id="pack_sequence-253"><a href="#pack_sequence-253"><span class="linenos">253</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="pack_sequence-254"><a href="#pack_sequence-254"><span class="linenos">254</span></a>  <span class="k">else</span><span class="p">:</span>
-</span><span id="pack_sequence-255"><a href="#pack_sequence-255"><span class="linenos">255</span></a>    <span class="n">mini_batch</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">))</span>
-</span><span id="pack_sequence-256"><a href="#pack_sequence-256"><span class="linenos">256</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="mi">0</span><span class="p">]],</span>
-</span><span id="pack_sequence-257"><a href="#pack_sequence-257"><span class="linenos">257</span></a>                          <span class="n">batch_size</span><span class="p">,</span>
-</span><span id="pack_sequence-258"><a href="#pack_sequence-258"><span class="linenos">258</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
-</span><span id="pack_sequence-259"><a href="#pack_sequence-259"><span class="linenos">259</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">batch_size</span><span class="p">):</span>
-</span><span id="pack_sequence-260"><a href="#pack_sequence-260"><span class="linenos">260</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]],</span>
-</span><span id="pack_sequence-261"><a href="#pack_sequence-261"><span class="linenos">261</span></a>                <span class="n">i</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]]]</span>
-</span><span id="pack_sequence-262"><a href="#pack_sequence-262"><span class="linenos">262</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
-</span><span id="pack_sequence-263"><a href="#pack_sequence-263"><span class="linenos">263</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
-</span><span id="pack_sequence-264"><a href="#pack_sequence-264"><span class="linenos">264</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
-</span><span id="pack_sequence-265"><a href="#pack_sequence-265"><span class="linenos">265</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">],</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="pack_sequence-266"><a href="#pack_sequence-266"><span class="linenos">266</span></a>  <span class="c1"># ground truth is the shifted input</span>
-</span><span id="pack_sequence-267"><a href="#pack_sequence-267"><span class="linenos">267</span></a>  <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:,</span> <span class="p">:,</span> <span class="p">:]</span>
-</span><span id="pack_sequence-268"><a href="#pack_sequence-268"><span class="linenos">268</span></a>  <span class="k">return</span> <span class="n">packed_rnn_input</span><span class="p">,</span> <span class="n">rnn_truth</span>
+</span><span id="pack_sequence-226"><a href="#pack_sequence-226"><span class="linenos">226</span></a>  <span class="k">if</span> <span class="n">batch_size</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="pack_sequence-227"><a href="#pack_sequence-227"><span class="linenos">227</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+</span><span id="pack_sequence-228"><a href="#pack_sequence-228"><span class="linenos">228</span></a>                          <span class="n">num_clusters</span><span class="p">,</span>
+</span><span id="pack_sequence-229"><a href="#pack_sequence-229"><span class="linenos">229</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
+</span><span id="pack_sequence-230"><a href="#pack_sequence-230"><span class="linenos">230</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">):</span>
+</span><span id="pack_sequence-231"><a href="#pack_sequence-231"><span class="linenos">231</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">i</span><span class="p">,</span>
+</span><span id="pack_sequence-232"><a href="#pack_sequence-232"><span class="linenos">232</span></a>                <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="pack_sequence-233"><a href="#pack_sequence-233"><span class="linenos">233</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="pack_sequence-234"><a href="#pack_sequence-234"><span class="linenos">234</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
+</span><span id="pack_sequence-235"><a href="#pack_sequence-235"><span class="linenos">235</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
+</span><span id="pack_sequence-236"><a href="#pack_sequence-236"><span class="linenos">236</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">,</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="pack_sequence-237"><a href="#pack_sequence-237"><span class="linenos">237</span></a>  <span class="k">else</span><span class="p">:</span>
+</span><span id="pack_sequence-238"><a href="#pack_sequence-238"><span class="linenos">238</span></a>    <span class="n">mini_batch</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">num_clusters</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">))</span>
+</span><span id="pack_sequence-239"><a href="#pack_sequence-239"><span class="linenos">239</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="mi">0</span><span class="p">]],</span>
+</span><span id="pack_sequence-240"><a href="#pack_sequence-240"><span class="linenos">240</span></a>                          <span class="n">batch_size</span><span class="p">,</span>
+</span><span id="pack_sequence-241"><a href="#pack_sequence-241"><span class="linenos">241</span></a>                          <span class="n">observation_dim</span><span class="p">))</span>
+</span><span id="pack_sequence-242"><a href="#pack_sequence-242"><span class="linenos">242</span></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">batch_size</span><span class="p">):</span>
+</span><span id="pack_sequence-243"><a href="#pack_sequence-243"><span class="linenos">243</span></a>      <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:</span><span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]],</span>
+</span><span id="pack_sequence-244"><a href="#pack_sequence-244"><span class="linenos">244</span></a>                <span class="n">i</span><span class="p">,</span> <span class="p">:]</span> <span class="o">=</span> <span class="n">sub_sequences</span><span class="p">[</span><span class="n">permute_index</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">[</span><span class="n">i</span><span class="p">]]]</span>
+</span><span id="pack_sequence-245"><a href="#pack_sequence-245"><span class="linenos">245</span></a>    <span class="n">rnn_input</span> <span class="o">=</span> <span class="n">autograd</span><span class="o">.</span><span class="n">Variable</span><span class="p">(</span>
+</span><span id="pack_sequence-246"><a href="#pack_sequence-246"><span class="linenos">246</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">from_numpy</span><span class="p">(</span><span class="n">rnn_input</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">())</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
+</span><span id="pack_sequence-247"><a href="#pack_sequence-247"><span class="linenos">247</span></a>    <span class="n">packed_rnn_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">utils</span><span class="o">.</span><span class="n">rnn</span><span class="o">.</span><span class="n">pack_padded_sequence</span><span class="p">(</span>
+</span><span id="pack_sequence-248"><a href="#pack_sequence-248"><span class="linenos">248</span></a>        <span class="n">rnn_input</span><span class="p">,</span> <span class="n">sorted_seq_lengths</span><span class="p">[</span><span class="n">mini_batch</span><span class="p">],</span> <span class="n">batch_first</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="pack_sequence-249"><a href="#pack_sequence-249"><span class="linenos">249</span></a>  <span class="c1"># ground truth is the shifted input</span>
+</span><span id="pack_sequence-250"><a href="#pack_sequence-250"><span class="linenos">250</span></a>  <span class="n">rnn_truth</span> <span class="o">=</span> <span class="n">rnn_input</span><span class="p">[</span><span class="mi">1</span><span class="p">:,</span> <span class="p">:,</span> <span class="p">:]</span>
+</span><span id="pack_sequence-251"><a href="#pack_sequence-251"><span class="linenos">251</span></a>  <span class="k">return</span> <span class="n">packed_rnn_input</span><span class="p">,</span> <span class="n">rnn_truth</span>
 </span></pre></div>
 
 
@@ -922,39 +812,39 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#output_result"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="output_result-271"><a href="#output_result-271"><span class="linenos">271</span></a><span class="k">def</span> <span class="nf">output_result</span><span class="p">(</span><span class="n">model_args</span><span class="p">,</span> <span class="n">training_args</span><span class="p">,</span> <span class="n">test_record</span><span class="p">):</span>
-</span><span id="output_result-272"><a href="#output_result-272"><span class="linenos">272</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Produce a string to summarize the experiment.&quot;&quot;&quot;</span>
-</span><span id="output_result-273"><a href="#output_result-273"><span class="linenos">273</span></a>  <span class="n">accuracy_array</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">test_record</span><span class="p">)</span>
-</span><span id="output_result-274"><a href="#output_result-274"><span class="linenos">274</span></a>  <span class="n">total_accuracy</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">accuracy_array</span><span class="p">)</span>
-</span><span id="output_result-275"><a href="#output_result-275"><span class="linenos">275</span></a>  <span class="n">output_string</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
-</span><span id="output_result-276"><a href="#output_result-276"><span class="linenos">276</span></a><span class="s2">Config:</span>
-</span><span id="output_result-277"><a href="#output_result-277"><span class="linenos">277</span></a><span class="s2">  sigma_alpha: </span><span class="si">{}</span>
-</span><span id="output_result-278"><a href="#output_result-278"><span class="linenos">278</span></a><span class="s2">  sigma_beta: </span><span class="si">{}</span>
-</span><span id="output_result-279"><a href="#output_result-279"><span class="linenos">279</span></a><span class="s2">  crp_alpha: </span><span class="si">{}</span>
-</span><span id="output_result-280"><a href="#output_result-280"><span class="linenos">280</span></a><span class="s2">  learning rate: </span><span class="si">{}</span>
-</span><span id="output_result-281"><a href="#output_result-281"><span class="linenos">281</span></a><span class="s2">  regularization: </span><span class="si">{}</span>
-</span><span id="output_result-282"><a href="#output_result-282"><span class="linenos">282</span></a><span class="s2">  batch size: </span><span class="si">{}</span>
-</span><span id="output_result-283"><a href="#output_result-283"><span class="linenos">283</span></a>
-</span><span id="output_result-284"><a href="#output_result-284"><span class="linenos">284</span></a><span class="s2">Performance:</span>
-</span><span id="output_result-285"><a href="#output_result-285"><span class="linenos">285</span></a><span class="s2">  averaged accuracy: </span><span class="si">{:.6f}</span>
-</span><span id="output_result-286"><a href="#output_result-286"><span class="linenos">286</span></a><span class="s2">  accuracy numbers for all testing sequences:</span>
-</span><span id="output_result-287"><a href="#output_result-287"><span class="linenos">287</span></a><span class="s2">  &quot;&quot;&quot;</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="output_result-288"><a href="#output_result-288"><span class="linenos">288</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span>
-</span><span id="output_result-289"><a href="#output_result-289"><span class="linenos">289</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span>
-</span><span id="output_result-290"><a href="#output_result-290"><span class="linenos">290</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
-</span><span id="output_result-291"><a href="#output_result-291"><span class="linenos">291</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span>
-</span><span id="output_result-292"><a href="#output_result-292"><span class="linenos">292</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">,</span>
-</span><span id="output_result-293"><a href="#output_result-293"><span class="linenos">293</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
-</span><span id="output_result-294"><a href="#output_result-294"><span class="linenos">294</span></a>      <span class="n">total_accuracy</span><span class="p">)</span>
-</span><span id="output_result-295"><a href="#output_result-295"><span class="linenos">295</span></a>  <span class="k">for</span> <span class="n">accuracy</span> <span class="ow">in</span> <span class="n">accuracy_array</span><span class="p">:</span>
-</span><span id="output_result-296"><a href="#output_result-296"><span class="linenos">296</span></a>    <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">    </span><span class="si">{:.6f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy</span><span class="p">)</span>
-</span><span id="output_result-297"><a href="#output_result-297"><span class="linenos">297</span></a>  <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span> <span class="o">+</span> <span class="s1">&#39;=&#39;</span> <span class="o">*</span> <span class="mi">80</span> <span class="o">+</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span>
-</span><span id="output_result-298"><a href="#output_result-298"><span class="linenos">298</span></a>  <span class="n">filename</span> <span class="o">=</span> <span class="s1">&#39;layer_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{:.1f}</span><span class="s1">_result.txt&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-</span><span id="output_result-299"><a href="#output_result-299"><span class="linenos">299</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
-</span><span id="output_result-300"><a href="#output_result-300"><span class="linenos">300</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span>
-</span><span id="output_result-301"><a href="#output_result-301"><span class="linenos">301</span></a>  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s1">&#39;a&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file_object</span><span class="p">:</span>
-</span><span id="output_result-302"><a href="#output_result-302"><span class="linenos">302</span></a>    <span class="n">file_object</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">output_string</span><span class="p">)</span>
-</span><span id="output_result-303"><a href="#output_result-303"><span class="linenos">303</span></a>  <span class="k">return</span> <span class="n">output_string</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="output_result-254"><a href="#output_result-254"><span class="linenos">254</span></a><span class="k">def</span> <span class="nf">output_result</span><span class="p">(</span><span class="n">model_args</span><span class="p">,</span> <span class="n">training_args</span><span class="p">,</span> <span class="n">test_record</span><span class="p">):</span>
+</span><span id="output_result-255"><a href="#output_result-255"><span class="linenos">255</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Produce a string to summarize the experiment.&quot;&quot;&quot;</span>
+</span><span id="output_result-256"><a href="#output_result-256"><span class="linenos">256</span></a>  <span class="n">accuracy_array</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="n">test_record</span><span class="p">)</span>
+</span><span id="output_result-257"><a href="#output_result-257"><span class="linenos">257</span></a>  <span class="n">total_accuracy</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">accuracy_array</span><span class="p">)</span>
+</span><span id="output_result-258"><a href="#output_result-258"><span class="linenos">258</span></a>  <span class="n">output_string</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
+</span><span id="output_result-259"><a href="#output_result-259"><span class="linenos">259</span></a><span class="s2">Config:</span>
+</span><span id="output_result-260"><a href="#output_result-260"><span class="linenos">260</span></a><span class="s2">  sigma_alpha: </span><span class="si">{}</span>
+</span><span id="output_result-261"><a href="#output_result-261"><span class="linenos">261</span></a><span class="s2">  sigma_beta: </span><span class="si">{}</span>
+</span><span id="output_result-262"><a href="#output_result-262"><span class="linenos">262</span></a><span class="s2">  crp_alpha: </span><span class="si">{}</span>
+</span><span id="output_result-263"><a href="#output_result-263"><span class="linenos">263</span></a><span class="s2">  learning rate: </span><span class="si">{}</span>
+</span><span id="output_result-264"><a href="#output_result-264"><span class="linenos">264</span></a><span class="s2">  regularization: </span><span class="si">{}</span>
+</span><span id="output_result-265"><a href="#output_result-265"><span class="linenos">265</span></a><span class="s2">  batch size: </span><span class="si">{}</span>
+</span><span id="output_result-266"><a href="#output_result-266"><span class="linenos">266</span></a>
+</span><span id="output_result-267"><a href="#output_result-267"><span class="linenos">267</span></a><span class="s2">Performance:</span>
+</span><span id="output_result-268"><a href="#output_result-268"><span class="linenos">268</span></a><span class="s2">  averaged accuracy: </span><span class="si">{:.6f}</span>
+</span><span id="output_result-269"><a href="#output_result-269"><span class="linenos">269</span></a><span class="s2">  accuracy numbers for all testing sequences:</span>
+</span><span id="output_result-270"><a href="#output_result-270"><span class="linenos">270</span></a><span class="s2">  &quot;&quot;&quot;</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="output_result-271"><a href="#output_result-271"><span class="linenos">271</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_alpha</span><span class="p">,</span>
+</span><span id="output_result-272"><a href="#output_result-272"><span class="linenos">272</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">sigma_beta</span><span class="p">,</span>
+</span><span id="output_result-273"><a href="#output_result-273"><span class="linenos">273</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">crp_alpha</span><span class="p">,</span>
+</span><span id="output_result-274"><a href="#output_result-274"><span class="linenos">274</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">learning_rate</span><span class="p">,</span>
+</span><span id="output_result-275"><a href="#output_result-275"><span class="linenos">275</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">regularization_weight</span><span class="p">,</span>
+</span><span id="output_result-276"><a href="#output_result-276"><span class="linenos">276</span></a>      <span class="n">training_args</span><span class="o">.</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="output_result-277"><a href="#output_result-277"><span class="linenos">277</span></a>      <span class="n">total_accuracy</span><span class="p">)</span>
+</span><span id="output_result-278"><a href="#output_result-278"><span class="linenos">278</span></a>  <span class="k">for</span> <span class="n">accuracy</span> <span class="ow">in</span> <span class="n">accuracy_array</span><span class="p">:</span>
+</span><span id="output_result-279"><a href="#output_result-279"><span class="linenos">279</span></a>    <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">    </span><span class="si">{:.6f}</span><span class="s1">&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy</span><span class="p">)</span>
+</span><span id="output_result-280"><a href="#output_result-280"><span class="linenos">280</span></a>  <span class="n">output_string</span> <span class="o">+=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span> <span class="o">+</span> <span class="s1">&#39;=&#39;</span> <span class="o">*</span> <span class="mi">80</span> <span class="o">+</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span>
+</span><span id="output_result-281"><a href="#output_result-281"><span class="linenos">281</span></a>  <span class="n">filename</span> <span class="o">=</span> <span class="s1">&#39;layer_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{}</span><span class="s1">_</span><span class="si">{:.1f}</span><span class="s1">_result.txt&#39;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
+</span><span id="output_result-282"><a href="#output_result-282"><span class="linenos">282</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_hidden_size</span><span class="p">,</span>
+</span><span id="output_result-283"><a href="#output_result-283"><span class="linenos">283</span></a>      <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_depth</span><span class="p">,</span> <span class="n">model_args</span><span class="o">.</span><span class="n">rnn_dropout</span><span class="p">)</span>
+</span><span id="output_result-284"><a href="#output_result-284"><span class="linenos">284</span></a>  <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">filename</span><span class="p">,</span> <span class="s1">&#39;a&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file_object</span><span class="p">:</span>
+</span><span id="output_result-285"><a href="#output_result-285"><span class="linenos">285</span></a>    <span class="n">file_object</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">output_string</span><span class="p">)</span>
+</span><span id="output_result-286"><a href="#output_result-286"><span class="linenos">286</span></a>  <span class="k">return</span> <span class="n">output_string</span>
 </span></pre></div>
 
 
@@ -974,32 +864,32 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#estimate_transition_bias"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="estimate_transition_bias-306"><a href="#estimate_transition_bias-306"><span class="linenos">306</span></a><span class="k">def</span> <span class="nf">estimate_transition_bias</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="n">smooth</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
-</span><span id="estimate_transition_bias-307"><a href="#estimate_transition_bias-307"><span class="linenos">307</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Estimate the transition bias.</span>
-</span><span id="estimate_transition_bias-308"><a href="#estimate_transition_bias-308"><span class="linenos">308</span></a>
-</span><span id="estimate_transition_bias-309"><a href="#estimate_transition_bias-309"><span class="linenos">309</span></a><span class="sd">  Args:</span>
-</span><span id="estimate_transition_bias-310"><a href="#estimate_transition_bias-310"><span class="linenos">310</span></a><span class="sd">    cluster_id: Either a list of cluster indicator sequences, or a single</span>
-</span><span id="estimate_transition_bias-311"><a href="#estimate_transition_bias-311"><span class="linenos">311</span></a><span class="sd">      concatenated sequence. The former is strongly preferred, since the</span>
-</span><span id="estimate_transition_bias-312"><a href="#estimate_transition_bias-312"><span class="linenos">312</span></a><span class="sd">      transition_bias estimated from the latter will be inaccurate.</span>
-</span><span id="estimate_transition_bias-313"><a href="#estimate_transition_bias-313"><span class="linenos">313</span></a><span class="sd">    smooth: int or float - Smoothing coefficient, avoids -inf value in np.log</span>
-</span><span id="estimate_transition_bias-314"><a href="#estimate_transition_bias-314"><span class="linenos">314</span></a><span class="sd">      in the case of a sequence with a single speaker and division by 0 in the</span>
-</span><span id="estimate_transition_bias-315"><a href="#estimate_transition_bias-315"><span class="linenos">315</span></a><span class="sd">      case of empty sequences. Using a small value for smooth decreases the</span>
-</span><span id="estimate_transition_bias-316"><a href="#estimate_transition_bias-316"><span class="linenos">316</span></a><span class="sd">      bias in the calculation of transition_bias but can also lead to underflow</span>
-</span><span id="estimate_transition_bias-317"><a href="#estimate_transition_bias-317"><span class="linenos">317</span></a><span class="sd">      in some remote cases, larger values are safer but less accurate.</span>
-</span><span id="estimate_transition_bias-318"><a href="#estimate_transition_bias-318"><span class="linenos">318</span></a>
-</span><span id="estimate_transition_bias-319"><a href="#estimate_transition_bias-319"><span class="linenos">319</span></a><span class="sd">  Returns:</span>
-</span><span id="estimate_transition_bias-320"><a href="#estimate_transition_bias-320"><span class="linenos">320</span></a><span class="sd">    bias: Flipping coin head probability.</span>
-</span><span id="estimate_transition_bias-321"><a href="#estimate_transition_bias-321"><span class="linenos">321</span></a><span class="sd">    bias_denominator: The denominator of the bias, used for multiple calls to</span>
-</span><span id="estimate_transition_bias-322"><a href="#estimate_transition_bias-322"><span class="linenos">322</span></a><span class="sd">      fit().</span>
-</span><span id="estimate_transition_bias-323"><a href="#estimate_transition_bias-323"><span class="linenos">323</span></a><span class="sd">  &quot;&quot;&quot;</span>
-</span><span id="estimate_transition_bias-324"><a href="#estimate_transition_bias-324"><span class="linenos">324</span></a>  <span class="n">transit_num</span> <span class="o">=</span> <span class="n">smooth</span>
-</span><span id="estimate_transition_bias-325"><a href="#estimate_transition_bias-325"><span class="linenos">325</span></a>  <span class="n">bias_denominator</span> <span class="o">=</span> <span class="mi">2</span> <span class="o">*</span> <span class="n">smooth</span>
-</span><span id="estimate_transition_bias-326"><a href="#estimate_transition_bias-326"><span class="linenos">326</span></a>  <span class="k">for</span> <span class="n">cluster_id_seq</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
-</span><span id="estimate_transition_bias-327"><a href="#estimate_transition_bias-327"><span class="linenos">327</span></a>    <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="estimate_transition_bias-328"><a href="#estimate_transition_bias-328"><span class="linenos">328</span></a>      <span class="n">transit_num</span> <span class="o">+=</span> <span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span><span class="p">]</span> <span class="o">!=</span> <span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span> <span class="o">+</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="estimate_transition_bias-329"><a href="#estimate_transition_bias-329"><span class="linenos">329</span></a>      <span class="n">bias_denominator</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="estimate_transition_bias-330"><a href="#estimate_transition_bias-330"><span class="linenos">330</span></a>  <span class="n">bias</span> <span class="o">=</span> <span class="n">transit_num</span> <span class="o">/</span> <span class="n">bias_denominator</span>
-</span><span id="estimate_transition_bias-331"><a href="#estimate_transition_bias-331"><span class="linenos">331</span></a>  <span class="k">return</span> <span class="n">bias</span><span class="p">,</span> <span class="n">bias_denominator</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="estimate_transition_bias-289"><a href="#estimate_transition_bias-289"><span class="linenos">289</span></a><span class="k">def</span> <span class="nf">estimate_transition_bias</span><span class="p">(</span><span class="n">cluster_ids</span><span class="p">,</span> <span class="n">smooth</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="estimate_transition_bias-290"><a href="#estimate_transition_bias-290"><span class="linenos">290</span></a><span class="w">  </span><span class="sd">&quot;&quot;&quot;Estimate the transition bias.</span>
+</span><span id="estimate_transition_bias-291"><a href="#estimate_transition_bias-291"><span class="linenos">291</span></a>
+</span><span id="estimate_transition_bias-292"><a href="#estimate_transition_bias-292"><span class="linenos">292</span></a><span class="sd">  Args:</span>
+</span><span id="estimate_transition_bias-293"><a href="#estimate_transition_bias-293"><span class="linenos">293</span></a><span class="sd">    cluster_id: Either a list of cluster indicator sequences, or a single</span>
+</span><span id="estimate_transition_bias-294"><a href="#estimate_transition_bias-294"><span class="linenos">294</span></a><span class="sd">      concatenated sequence. The former is strongly preferred, since the</span>
+</span><span id="estimate_transition_bias-295"><a href="#estimate_transition_bias-295"><span class="linenos">295</span></a><span class="sd">      transition_bias estimated from the latter will be inaccurate.</span>
+</span><span id="estimate_transition_bias-296"><a href="#estimate_transition_bias-296"><span class="linenos">296</span></a><span class="sd">    smooth: int or float - Smoothing coefficient, avoids -inf value in np.log</span>
+</span><span id="estimate_transition_bias-297"><a href="#estimate_transition_bias-297"><span class="linenos">297</span></a><span class="sd">      in the case of a sequence with a single speaker and division by 0 in the</span>
+</span><span id="estimate_transition_bias-298"><a href="#estimate_transition_bias-298"><span class="linenos">298</span></a><span class="sd">      case of empty sequences. Using a small value for smooth decreases the</span>
+</span><span id="estimate_transition_bias-299"><a href="#estimate_transition_bias-299"><span class="linenos">299</span></a><span class="sd">      bias in the calculation of transition_bias but can also lead to underflow</span>
+</span><span id="estimate_transition_bias-300"><a href="#estimate_transition_bias-300"><span class="linenos">300</span></a><span class="sd">      in some remote cases, larger values are safer but less accurate.</span>
+</span><span id="estimate_transition_bias-301"><a href="#estimate_transition_bias-301"><span class="linenos">301</span></a>
+</span><span id="estimate_transition_bias-302"><a href="#estimate_transition_bias-302"><span class="linenos">302</span></a><span class="sd">  Returns:</span>
+</span><span id="estimate_transition_bias-303"><a href="#estimate_transition_bias-303"><span class="linenos">303</span></a><span class="sd">    bias: Flipping coin head probability.</span>
+</span><span id="estimate_transition_bias-304"><a href="#estimate_transition_bias-304"><span class="linenos">304</span></a><span class="sd">    bias_denominator: The denominator of the bias, used for multiple calls to</span>
+</span><span id="estimate_transition_bias-305"><a href="#estimate_transition_bias-305"><span class="linenos">305</span></a><span class="sd">      fit().</span>
+</span><span id="estimate_transition_bias-306"><a href="#estimate_transition_bias-306"><span class="linenos">306</span></a><span class="sd">  &quot;&quot;&quot;</span>
+</span><span id="estimate_transition_bias-307"><a href="#estimate_transition_bias-307"><span class="linenos">307</span></a>  <span class="n">transit_num</span> <span class="o">=</span> <span class="n">smooth</span>
+</span><span id="estimate_transition_bias-308"><a href="#estimate_transition_bias-308"><span class="linenos">308</span></a>  <span class="n">bias_denominator</span> <span class="o">=</span> <span class="mi">2</span> <span class="o">*</span> <span class="n">smooth</span>
+</span><span id="estimate_transition_bias-309"><a href="#estimate_transition_bias-309"><span class="linenos">309</span></a>  <span class="k">for</span> <span class="n">cluster_id_seq</span> <span class="ow">in</span> <span class="n">cluster_ids</span><span class="p">:</span>
+</span><span id="estimate_transition_bias-310"><a href="#estimate_transition_bias-310"><span class="linenos">310</span></a>    <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="estimate_transition_bias-311"><a href="#estimate_transition_bias-311"><span class="linenos">311</span></a>      <span class="n">transit_num</span> <span class="o">+=</span> <span class="p">(</span><span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span><span class="p">]</span> <span class="o">!=</span> <span class="n">cluster_id_seq</span><span class="p">[</span><span class="n">entry</span> <span class="o">+</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="estimate_transition_bias-312"><a href="#estimate_transition_bias-312"><span class="linenos">312</span></a>      <span class="n">bias_denominator</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="estimate_transition_bias-313"><a href="#estimate_transition_bias-313"><span class="linenos">313</span></a>  <span class="n">bias</span> <span class="o">=</span> <span class="n">transit_num</span> <span class="o">/</span> <span class="n">bias_denominator</span>
+</span><span id="estimate_transition_bias-314"><a href="#estimate_transition_bias-314"><span class="linenos">314</span></a>  <span class="k">return</span> <span class="n">bias</span><span class="p">,</span> <span class="n">bias_denominator</span>
 </span></pre></div>
 
 
diff --git a/setup.py b/setup.py
index 64f2265..b8d687b 100644
--- a/setup.py
+++ b/setup.py
@@ -15,7 +15,7 @@
 
 import setuptools
 
-VERSION = '0.1.0'
+VERSION = '0.1.1'
 
 with open('README.md', 'r') as file_object:
   LONG_DESCRIPTION = file_object.read()
diff --git a/tests/integration_test.py b/tests/integration_test.py
index 6d02648..5d078a6 100644
--- a/tests/integration_test.py
+++ b/tests/integration_test.py
@@ -109,8 +109,8 @@ def test_four_clusters(self):
     predicted_label = model.predict(test_sequence, inference_args)
 
     # run evaluation
-    model.logger.print(
-        3, 'Asserting the equivalence between'
+    model.logger.info(
+        'Asserting the equivalence between'
         '\nGround truth: {}\nPredicted: {}'.format(
             test_cluster_id, predicted_label))
     accuracy = uisrnn.compute_sequence_match_accuracy(
@@ -125,8 +125,8 @@ def test_four_clusters(self):
     predicted_label = loaded_model.predict(test_sequence, inference_args)
 
     # run evaluation with loaded model
-    model.logger.print(
-        3, 'Asserting the equivalence between'
+    model.logger.info(
+        'Asserting the equivalence between'
         '\nGround truth: {}\nPredicted: {}'.format(
             test_cluster_id, predicted_label))
     accuracy = uisrnn.compute_sequence_match_accuracy(
@@ -140,13 +140,13 @@ def test_four_clusters(self):
     model.fit(train_sequence[:100, :], train_cluster_id[:100], training_args)
     transition_bias_2 = model.transition_bias
     self.assertNotAlmostEqual(transition_bias_1, transition_bias_2)
-    model.logger.print(
-        3, 'Asserting transition_bias changed from {} to {}'.format(
+    model.logger.info(
+        'Asserting transition_bias changed from {} to {}'.format(
             transition_bias_1, transition_bias_2))
 
     # run evaluation
-    model.logger.print(
-        3, 'Asserting the equivalence between'
+    model.logger.info(
+        'Asserting the equivalence between'
         '\nGround truth: {}\nPredicted: {}'.format(
             test_cluster_id, predicted_label))
     accuracy = uisrnn.compute_sequence_match_accuracy(
diff --git a/uisrnn/arguments.py b/uisrnn/arguments.py
index c4eeeba..c539c07 100644
--- a/uisrnn/arguments.py
+++ b/uisrnn/arguments.py
@@ -87,12 +87,12 @@ def parse_arguments():
            'value is None, we will estimate it from training data.')
   model_parser.add_argument(
       '--verbosity',
-      default=2,
+      default=3,
       type=int,
       help='How verbose will the logging information be. Higher value '
       'represents more verbose information. A general guideline: '
-      '0 for errors; 1 for finishing important steps; '
-      '2 for finishing less important steps; 3 or above for debugging '
+      '0 for fatals; 1 for errors; 2 for finishing important steps; '
+      '3 for finishing less important steps; 4 or above for debugging '
       'information.')
   model_parser.add_argument(
       '--enable_cuda',
diff --git a/uisrnn/uisrnn.py b/uisrnn/uisrnn.py
index e951346..e1a1822 100644
--- a/uisrnn/uisrnn.py
+++ b/uisrnn/uisrnn.py
@@ -13,6 +13,7 @@
 # limitations under the License.
 """The UIS-RNN model."""
 
+import colortimelog
 import functools
 import numpy as np
 import torch
@@ -103,7 +104,7 @@ def __init__(self, args):
     self.transition_bias = args.transition_bias
     self.transition_bias_denominator = 0.0
     self.crp_alpha = args.crp_alpha
-    self.logger = utils.Logger(args.verbosity)
+    self.logger = colortimelog.Logger(args.verbosity)
 
   def _get_optimizer(self, optimizer, learning_rate):
     """Get optimizer for UISRNN.
diff --git a/uisrnn/utils.py b/uisrnn/utils.py
index 83d760b..6558b47 100644
--- a/uisrnn/utils.py
+++ b/uisrnn/utils.py
@@ -21,23 +21,6 @@
 from torch import autograd
 
 
-class Logger:
-  """A class for printing logging information to screen."""
-
-  def __init__(self, verbosity):
-    self._verbosity = verbosity
-
-  def print(self, level, message):
-    """Print a message if level is not higher than verbosity.
-
-    Args:
-      level: the level of this message, smaller value means more important
-      message: the message to be printed
-    """
-    if level <= self._verbosity:
-      print(message)
-
-
 def generate_random_string(length=6):
   """Generate a random string of upper case letters and digits.