Posts

Dynamic Routing Between Capsules (2017)

カプセルはおなじ層にあるニューロン(ユニット)をグループであり、カプセルの出力するベクトルは入力にある特定のエンティティの分散表現になる。 表題のdynamic routingは、カプセルの出力ベクトルを1つ上の層のどのカプセルに渡すべきかを学習する手法である。 これにより、プーリング層で失われるエンティティの空間上の位置情報をカプセルの出力するベクトルで表現できる。 実験では、2層の畳み込み層と1層の全結合層からなる浅いニューラルネットワークをMNISTに適用し、長さでエンティティが存在する確率を、向きでエンティティの特徴を表現できるベクトルを学習できることを示した。

Hierarchical Attention Networks for Document Classification (2016)

Hierarchical Attention Network(HAN)は、単語は文から文書は文からなりたつ文書の構造をアーキテクチャに反映し、単語の注意から文の注意を、文の注意から文書の注意を計算する。 順方向と逆方向の2つのGRUでエンコードした単語の分散表現から注意を計算し、文ごとに、単語の注意の重みつき和を計算し文の分散表現とする。 さらに、文の分散表現を別の順、逆方向GRUにあたえ、単語とおなじように各文の注意を計算し、その重みつき和を文書の分散表現としてあつかう。 最後に、文書の分散表現を全結合層に入力し、ソフトマックス関数で文書のクラスを推定する。 単語の文の注意を推定できるため、単語と文の2つの粒度で文書の重要な箇所を可視化することができる。

Effective Approaches to Attention-based Neural Machine Translation (2015)

注意機構をつかった翻訳用のニューラルネットワークを2種類例示し、翻訳における効果的な注意機構の使い方を提案した。 どちらもスタッキングしたLSTMを使うが、注意の計算で参照するLSTMの隠れ状態が違う。 ひとつは、1単語を出力するときに、すべての単語のLSTMの隠れ状態から注意を算出するグローバルなアプローチで、もうひとつは一部の単語の状態だけから注意を算出するローカルなアプローチである。 英語とドイツ語の双方への翻訳タスクに適用したところ、ローカルなアプローチで注意機構をつかわない手法と比べてBLEUスコアを5.0ポイントできた。

Deep Learning Based Text Classification: A Comprehensive Review (2020)

深層学習によるテキスト分類のサーベイで、調査したモデル数の多さで論文の貢献を主張している。 文章の構成は、150個のモデル、40件のデータセット、定量的な評価指標の解説がつづく。 文書分類を広くとらえ、典型的なテキスト分類だけでなくQAやテキスト含意にもふれている。

Monitoring Streams - A New Class of Data Management Applications (2002)

センサー情報などにみられる継続的に発生するストリームデータの監視にむいた開発中のDBMS, Auroraを発表した。 既存のDBMSは人の行動で起きるトランザクションを想定している。 一方、ストリームデータは、人の能動的な活動によらず絶えず発生し、異常値があればアラートを出す必要がある。 また、グラフの描画などで時系列に長期的なデータをとり、また、リアルタイムに応答するために不要なデータを切り捨て負荷を下げる必要もある。 Auroraは、以上のストリーミング、トリガー、不正確なデータ、リアルタイム性の4特性を扱えるモデルとして、ストリームデータの出力元をソース、ノードをストリームデータの計算、シンクをアプリケーションとするDAGを採用する。 ノードで表す計算には、ストリームをウィンドウに区切る、フィルタ、リサンプリングなどの8つがある。 DAGで表せる計算をAurora内部で実行し、その結果が接続するアプリケーションにわたる。

A Birdging Model for parallel Computation (1990)

表題と同名の論文は、バッチ処理グラフの最適化として演算処理のバルク同期並列(bulk synchronous parallel、 BSP)を提唱した。 BPSは、Apache Giraph, Spark の GraphX API, Gelly APIで採用され、なかでもGoogleのPregelで知られるようになった*1。 BPSの目的は、フォン・ノイマンモデルのように、ハードウェアと並列計算の高水準なプログラミングモデルがどちらもBPSに準ずることで、高水準なプログラミングモデルで実装された並列計算を多様なハードウェア上で動かせるようにすることにある。 フォン・ノイマンモデル型のコンピュータであれば、ハードウェアの種類を意識することなく、その上で逐次計算をおこなう多様なソフトウェアを動かせる。 フォン・ノイマンモデルは、多様なハードウェアと多様なソフトウェアをつなぐ。 BPSは、並列計算用のハードウェアと高水準な並列計算のためのプログラミングモデルをつなぐためにある。

Wait-Free Synchronization

あるデータ構造がwait-freeであり、データ構造への操作が有限回のステップで完了するのであれば、ほかの並行プロセスの処理速度によらず、任意のプロセスによるその操作は必ず完了する。 表題のsynchronizationは、wait-freeなデータ構造から別のwait-freeなデータ構造を実装する意味であり、実装の可能性を議論するためにコンセンサス数が導入される。 あるデータ構造のコンセンサス数は、単純な含意形成問題を解くときに参加できるプロセス数の最大値である。 たとえば、read / writeレジスタには1, test & swapは2, compare & swapには無限のコンセンサス数が割りあてられる。 プロセス数を定義した上で、あるコンセンサス数のデータ構造を、それより小さいコンセンサス数のデータ構造では実装できないことを示した。

Live Migration of Virtual Machines

XenのハイパーバイザーにOSのライブマグレーションを統合し、約60msのダウンタイムでのOSのライブマイグレーションを実現した。 手法の焦点は、短いダウンタイムや移行時間で、移行元と移行先のメモリの状態を同等にできるかにある。 ネットワークアドレスや物理デバイスの移行は扱わない。 移行元と移行先は同じローカルネットワークにあり、マイグレーションによるIPアドレスのホストの移動を主にARP replyで通知でき、NASにデータを保存することを前提にし、ネットワークや物理デバイスの移行を考えなくてよいものとしている。

A Critique of ANSI SQL Isolation Levels

ANSI SQL-92規格は、トランザクション分離レベルを、Dirty Read, Non-Repeatable Reads, Phantomが発生する可能性で定義する。 トランザクション分離レベルを禁止する現象で定義する理由は、ロックなどの実装手段で定義すると規格が実装に依存するからだと考えられている。 表題の論文は、規格の現象による定義があいまいであり、3つの異常が起きなくても望まない結果になる実行があることを例示した。 また、規格のトランザクション分離レベルが、商用データベースで採用されているトランザクション分離レベルにあてはまらない問題もある。 禁止する現象にDirty Writeをくわえ、厳しく実行列を禁止するように現象の定義を解釈した上で自然言語から形式的な記述に変えることを提唱した。 さらに、規格がデータの版が単一であることを前提としていることを指摘した上で、多版型のトランザクションであるSnaphot Isolationを提案した。

An Overview of Data Warehousing and OLAP Technology

データウェアハウスの概要と発表時期の97年の関連技術を解説した論文で、 データウェアハウスの理論を提唱したInmonにならい、データウェアハウスを目的指向(subject-oriented)で、統合され、時刻を横断する組織の意思決定に資する永続的なデータとらえている。 関連技術を、ETL処理、データ保存方法、保存したデータによる分析の3つに分けて整理する。 データベースの設計手法では、Kimballの提唱したスタースキーマ、その応用のスノーフレークスキーマ, 事実の星座(fact constellations)、インデックスについてビットマップインデックスを解説する。