説明

コンピュータシステムデバイスのための光配線

本発明の種々の実施形態は、コンピュータシステム構成要素間におけるオンチップ通信にもオフチップ通信にも使用可能な光配線に関する。本発明の一実施形態において、光配線(108)は、複数のオンチップ導波路(308)を含む。更に、光配線は、複数のオフチップ導波路(310,620)、及び少なくとも1つの光電変換器(306)を含む。少なくとも1つの光電変換器(306)は、複数のオンチップ導波路の一部に光学的に結合することができ、複数のオフチップ導波路の一部に光学的に結合することができ、かつ、少なくとも1つのコンピュータシステム構成要素(615-618)と電気的に通信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、コンピュータシステムデバイスにおいて、オンチップ通信にも、コンピュータシステム構成要素間におけるオフチップ通信にも使用することが可能な光配線に関する。
【背景技術】
【0002】
1960年代半ば、半導体製造業者は、集積回路上に作成されるトランジスタのような回路の密度は、毎18ヶ月ごとに2倍になると考えていた。この傾向はその後も続き、現在では、「ムーアの法則」と呼ばれている。トランジスタ密度は概ね、コンピュータ処理能力と考えることができ、これは、言い換えるなら、データ処理速度に対応する。ムーアの法則は当初、観測結果として作られたが、時を経てムーアの法則は次第に、コンピュータ処理能力増大の背景となる基礎的な原動力として、半導体産業に広く受け入れられた。その結果、半導体製造業者は、チップ部品のサイズをマイクロスケール、及びナノスケールの寸法にまで縮小する種々の技術を開発した。コンピュータシステムのコンピュータシステムアーキテクチャ(その幾つかの例は、メモリモジュール、シングルコアプロセッサデバイス、又はマルチコアプロセッサデバイスである)は、ムーアの法則を維持しながらも、種々の制限に遭遇している。
【0003】
マルチコアシステムの例は、遭遇した問題の一部に過ぎない。近年、半導体産業は、「コア」と呼ばれる2以上のサブプロセッサを含む種々のプロセッサを開発した。例えば、デュアルコアプロセッサは2つのコアを含み、クワッドコアプロセッサは4つのコアを含む。通常、それらのコアは集積され、システムの他の部分に対する同じ配線を共用し、かつ、独立して動作することができる。半導体製造業者は、シングルコアのトランジスタ密度を向上させることも可能ではあるが、電力消費が非効率になることから、その方向へは動かなかった。代わりに、半導体製造業者は、単一ダイ上にパッケージングされるコアの数を増加させた。ダイは一層の半導体材料であり、その上に集積回路(「チップ」)が形成される。しかしながら、そのようなマルチコアチップを必要とする厳しい要件のデータ集約型アプリケーションにとって、能力向上を維持するための重要な問題として、オンチップ通信、及びオフチップ通信が浮上してきた。計算帯域幅は、増加するコアの数に比例して直線的に増加するが、マルチコアチップにおいて最上級の金属ワイヤを使用して通信可能なデータの速度は、それに比べて非常に遅い速度でしか増加しない。また、チップの縁に沿って設けられたピンを通じてチップ外でデータを通信することが出来る速度も、計算帯域幅に比べて非常に遅い速度でしか増加せず、実現可能な帯域幅は、オンチップ通信、及びオフチップ通信のエネルギーコストによって大幅に制限される。その結果、コンピュータアーキテクチャは現在、交差路にあり、物理学者、及びエンジニアは、オンチップ通信、及びオフチップ通信に金属ワイヤを使用する代替手段を捜している。
【発明の概要】
【課題を解決するための手段】
【0004】
本発明の種々の実施形態は、オンチップ通信にも、コンピュータシステム構成要素間におけるオフチップ通信にも使用可能な光配線に関する。本発明の一実施形態において、光配線は、複数のオンチップ導波路を含む。さらに、光配線は、複数のオフチップ導波路、及び少なくとも1つの光電変換器を含む場合がある。少なくとも1つの光電変換器は、複数のオンチップ導波路の一部に光学的に結合されることがあり、さらに複数のオフチップ導波路の一部に光学的に結合されることがあり、さらに、少なくとも1つのコンピュータシステム構成要素と電気的に通信することがある。
【図面の簡単な説明】
【0005】
【図1】本発明の種々の実施形態による積層型計算装置を示す断面図である。
【図2】本発明の種々の実施形態による計算装置の種々の構成要素を示す概略図である。
【図3】本発明の種々の実施形態による、図1に示した計算装置の4つのダイ層を示す分解斜視図である。
【図4A】本発明の種々の実施形態によるプロセッサダイのクラスタを示す図である。
【図4B】本発明の種々の実施形態によるメモリダイのタイルを示す図である。
【図5】本発明の種々の実施形態による図4A〜図4Bに示したクラスタ、及びタイルの種々の構成要素間における情報のやり取りを示す概略図である。
【図6】本発明の種々の実施形態による、図1に示した計算装置の4つのダイ層を示す拡大分解斜視図である。
【図7A】本発明の種々の実施形態によるオプティカルダイを示す概略図である。
【図7B】本発明の種々の実施形態による図7Aに示したオプティカルダイの一領域を拡大したものを示す概略図である。
【図7C】本発明の種々の実施形態による、図7Bにおいてライン7C−7Cに沿って切断して見たときのオンチップリッジ型導波路の一部を示す断面図である。
【図7D】本発明の種々の実施形態による2つのほぼ平行なフォトニック結晶導波路の一部を示す平面図である。
【図8】本発明の種々の実施形態による電磁放射源を示す概略図である。
【図9A】本発明の種々の実施形態による光電変換器を示す概略図である。
【図9B】本発明の種々の実施形態による光電変換器を示す概略図である。
【図10】本発明の種々の実施形態による光電変換器の変換器ブロックの種々の構成要素を示す概略図である。
【図11】本発明の種々の実施形態による光電変換器のデータ/制御ブロックを示す概略図である。
【図12】本発明の種々の実施形態による3つのデータ/制御ブロックを示す概略図である。
【図13】本発明の種々の実施形態による結束導波路変調器/検出器の拡大したものを示す概略図である。
【図14】本発明の種々の実施形態によるオフチップ通信ハブを示す図である。
【図15】本発明の種々の実施形態によるブロードキャストを示す図である。
【図16A】本発明の種々の実施形態による符号化されていない通信路においてデータを符号化するために使用される導波路マイクロリングシステムを示す図である。
【図16B】本発明の種々の実施形態による、導波路から符号化されたチャネルを抽出するために使用される導波路マイクロリングシステムを示す図である。
【図17】本発明の種々の実施形態によるマイクロリングを示す概略図である。
【図18A】本発明の種々の実施形態による4クラスタ積層型計算装置の例を示す概略図である。
【図18B】本発明の種々の実施形態による図18Aに示した調停システムの概略図である。
【図19】本発明の種々の実施形態による調停システムを示す図である。
【発明を実施するための形態】
【0006】
本発明の種々の実施形態は、光配線に関する。光配線は、コンピュータシステム構成要素(例えば、コア、クラスタ、メモリコントローラ)間におけるオンチップ光配線を提供する。さらに、光配線は実施形態によっては、外部装置上のコンピュータシステム構成要素へのオフチップ光配線をさらに提供する場合がある。本発明の種々の実施形態はさらに、ナノフォトニック部品を含む場合があり、それらは通常、一波長未満、又は1マイクロメートル未満の寸法を有する種々の構成要素を含む。
【0007】
こうした光配線によれば、オフチップでのデータの通信速度を、チップの縁に沿って配置される従来のピンに比べて高速化することが可能となり、より広い計算帯域幅が得られ、、従来の金属ワイヤに比べてオンチップ通信、及びオフチップ通信のためのエネルギー消費を低減することができ、また、追加の構成要素を収容するために配線を拡大縮小することが可能となり、例えば任意数のコアを有するプロセッサを収容することが可能となる。光配線のアーキテクチャは、非遮蔽的な、短い待ち時間で、かつ再構成可能なナノフォトニック・マイクロリングを使用して実施することができ、広い帯域幅、及び少ない待ち時間を提供し、最大計算帯域幅においてさえ、非常に低い電力消費を提供する。さらに、コンピュータシステムデバイスのアーキテクチャは、全てのメモリがメモリコントローラの近くに、又はプロセッサの直ぐ近くに配置されるように構成されることがある。本発明の種々の実施形態に従って構成されるオプティカルダイを使用するマルチコアベースの計算装置は、約20テラバイト/秒の速度で動作する場合がある。
【0008】
下記の説明において、「フォトニック」、及び「光学的に」という用語は、電磁スペクトルの可視部分のみに限られない波長を有する従来の、及び/又は量子化されたERを使用して動作する装置を意味する。以下に記載する種々のフォトニックスイッチ、及びスイッチ装置実施形態において、同じ材料を含む構造的に同様の多数の構成要素には、同じ参照符号が付され、説明を簡潔にするために、それらの構造、及び態様について説明は繰り返さない。
【0009】
マルチコア積層型計算装置
図1は、本発明の種々の実施形態による光配線を使用するマルチコア積層型計算装置である、例示的コンピュータデバイス(「計算装置」)100を示す断面図である。計算装置100は、プロセッサダイ102、メモリコントローラ/ディレクトリ/L2ダイ(「メモリコントローラダイ」)104、アナログ電子回路ダイ106、オプティカルダイ108、及びパッケージ116の中に積層された4つのメモリダイ110〜113を含む。積層されるメモリダイ110〜113は、ダイナミック・ランダム・アクセス・メモリ(DRAM)のような揮発性メモリであっても、不揮発性メモリであっても、あるいは揮発性メモリと不揮発性メモリの任意の組み合わせであってもよい。特に、積層されるメモリダイ110〜113は、8ギガバイト(GB)のDRAMであってもよい。計算装置100は、プロセッサダイ102の上面に配置されたヒートシンク118、並びに、メモリコントローラダイ104からアナログ電子回路ダイ106、及びオプティカルダイ108を通じて4つのメモリダイ110〜113まで延びる4つのスルーバイア120〜123により表された多数(例えば、数百個)のバイアをさらに含む。
【0010】
ダイ102、104、106、108、及び110〜113は、約25〜約50マイクロメートルの範囲の厚みを有することができる。ヒートシンク118は、プロセッサダイ102の計算処理により発生した熱を放散する働きをし、スルーバイア120〜123は、メモリダイ上のメモリコントローラを4つのメモリダイ110〜113にそれぞれ電気的に相互接続する金属被覆されたバイア、又はシリコン充填されたバイアであってもよい。メモリコントローラダイ104の中に配置されたメモリコントローラは、メモリダイ110〜113へ向かうデータ、及びメモリダイ110〜113から到来するデータの流れを管理するとともに、外部装置(図示せず)へ向かうデータ、及び外部装置から到来するデータの流れを管理する。オプティカルダイ108は、外部光配線124、及び126のような外部光配線を有するため、他のダイよりも大きく、これらの外部光配線は、データが符号化された電磁波を計算装置100へ伝送したり、計算装置100から伝送するために使用されることがある。オプティカルダイは、約24mm×24mmのサイズを有するが、この寸法は、実施形態によって変更してもよい。オプティカルダイ108とメモリダイ110の上面との間に、さらに、ダイアモンド層130が配置される場合がある。ダイアモンド層130は、約1〜10マイクロメートルの厚みを有することができ、プロセッサダイ102、及びメモリコントローラダイ104により生成された熱を放散し、消失させるために使用される場合がある。
【0011】
図1に示した三次元ダイ積層体によれば、オプティカルダイ108を電気的ダイ102、及び104に強固に結合させることが可能となり、短い待ち時間でメモリダイ110〜113にアクセスする機能が得られ、また、積層体における隣接するダイ102、104、及び110〜113にわたってクラスタロジック、及びメモリを分散させることにより、クラスタ内の電気的配線を従来の装置に比べて短くすることが可能となる。特に、メモリダイをメモリコントローラの近くに積み重ね、種々のメモリ層を貫通して延びるバイアを使用することで、従来のメモリをメモリコントローラに接続するために使用される非常に長く、高い抵抗値を有する配線に比べて、短い長さ、及び低い抵抗値の配線が得られる。その結果、計算装置100のダイ間において電気信号の伝送に必要となる電力、又は負荷は、従来のメモリをメモリコントローラに接続するために必要とされる電力に比べて大幅に少なくなる。
【0012】
図2は、本発明の種々の実施形態により相互接続された計算装置100のダイ102、104、及び108の種々の構成要素を示す概略図である。プロセッサダイ102は、クラスタ202〜204にそれぞれ示されるように、各クラスタが4つのコアのクラスタとして構成されるマルチコアプロセッサである。各コアは、図4を参照して後で説明されるように、プライベート第1レベル(「L1」)命令キャッシュ(図示せず)、及びプライベートL1データキャッシュ(図示せず)を含む。クラスタ202〜204はそれぞれ、L2キャッシュ206〜208により示されるプライベート共有第2レベル(「L2」)キャッシュ、及びメモリコントローラ210〜212により示される関連メモリコントローラを有する。メモリコントローラ210〜212はそれぞれ、クラスタ202〜204へ向かうデータ、及びクラスタ202〜204から到来するデータの流れを制御する。L2キャッシュ、及びメモリコントローラは、プロセッサダイ102に隣接するメモリコントローラダイ104に配置される。図2に示すように、オプティカルダイ108の光配線214によれば、クラスタ202〜204に関連するL2キャッシュ206〜208を互いに光通信させることができ、かつメモリコントローラ210〜212とも光通信させることが可能な配線が得られる。また、図2から分かるように、メモリコントローラ210〜211は、オフチップのデュアル・インライン・メモリ・モジュール(DIMM)216〜218のような外部メモリモジュールと光通信することが可能である。クラスタ202〜204は、DIMM216〜218のそれぞれと電気的に、又は光学的に通信することができる。
【0013】
プロセッサダイ102の各クラスタは、メモリコントローラダイ104上に配置された対応するメモリコントローラを有し、プロセッサダイ102の能力を拡大縮小する帯域幅を得るために、各メモリコントローラは、積層されたメモリダイ110〜113に接続され、又はオフチップメモリへの光接続を駆動する。クラスタはさらに、オプティカルダイ108を通して互いに光学的に接続され、広い帯域幅、少ない待ち時間、及び非常に少ない電力消費を提供する。従って、積層型計算装置100を自由に使用することが可能なプログラマは、高度な並列処理を表現することができ、ローカリティの問題に束縛されることはなく、従って、並列プログラム開発の難易度は大幅に低減される。さらに、計算装置100のアーキテクチャによれば、1フロップ当たり1バイトの帯域幅をDRAMに与えることが出来る場合がある。
【0014】
メモリダイ110〜113のそれぞれについて8GBのDRAMを選択した場合、積層されるメモリは、32ギガバイトのDRAMを備え、当該DRAMは、バイア120〜123のようなDRAMの中を通る複数のバイアを通して、メモリコントローラに直接接続される。バイアのローディング、又はバイアの使用に要する電力の量を最小限に抑えるために、DRAMは、約25〜50マイクロメートルの厚みを有する4つのメモリスタック層によって形成される。DRAMスタックの各層は、64個のほぼ同一の領域を含み、これらの領域は、上にあるプロセッサダイ102の種々のクラスタにマッピングされる。行アクセス時間を短縮し、及び複数同時アクセスを可能にするために、各DRAM領域は、複数のバンクにさらに分割される場合がある。例えば、20nmDRAM技術を使用した場合、各領域には、1Gビットのエラー訂正コードにより保護されたストレージが与えられ、その結果、メモリコントローラダイ104上の各メモリコントローラは、0.5Gバイトのメモリに電気的に接続される。複数のチャネルを有することで、メモリに与えられる帯域幅は増加する。帯域幅を増加させることで、DRAMにおけるバンク衝突は低減される。各メモリチャネルは、72個のデータビット、及び約30個のアドレス制御ビットからなる。1つのメモリコントローラにつき4チャネルであるものと仮定し、25マイクロメートル間隔でスルーバイアを使用した場合、スルーバイアの頭上面積は、メモリ層の3%未満になる場合がある。細かい間隔のスルーバイアを使用すれば、DRAMの構造は、単一の行アクセスからキャッシュライン全体を供給するような構造にすることが出来る。
【0015】
512GBのDRAMが望ましい場合、DRAMは、光学的に接続された64個の個別のメモリモジュール(「OCM」)として構成される場合がある。OCMは、上で説明した8GBのDRAMと同じ基礎技術を利用する。オプティカルダイ108は、2つの機能を実施する。第1に、オプティカルダイ108は、外部光配線124、及び126のような光ファイバ接続のためのインタフェースを提供する。第2に、オプティカルダイ108は、DRAMスタックのために、低電力のグローバル相互接続を提供する。OCM、及びプロセッサは、光ファイバを通して接続され、光ファイバは、コマンド、又は特定用途向けデータの交換に使用することが可能な48本ものチャネルを提供する。
【0016】
マルチコア積層型計算装置の全体的動作
簡単にするために、以下では、プロセッサダイ102が64個のクワッドコアクラスタを含む計算装置100を例として、本発明の光配線の種々の実施形態について説明する。当業者には明らかなように、計算装置100において、本発明の光配線の種々の実施形態がそのような装置に制限されることはなく、それらの実施形態は、種々の構成を成す任意数のコアを備えた任意数のクラスタを有するマルチコア計算装置用の光配線を提供するように変更を加えた上で、実施される場合もある。
【0017】
図3は、本発明の種々の実施形態によるフォトニックダイ102、メモリコントローラダイ104、アナログ電子回路ダイ106、及びオプティカルダイ108を示す分解斜視図である。図3に示すように、プロセッサダイ102、及びメモリコントローラダイ104は、64個のタイルに分割される。プロセッサダイ102における各タイルは、「クラスタ」と呼ばれる4つのコアに相当し、メモリコントローラダイ104における各タイルは、そのほぼ真上に位置するプロセッサダイ102上の対応するクラスタと電気的に通信するL2キャッシュ、ハブ、メモリコントローラ、及び他のデバイスに相当する。例えば、メモリコントローラダイ104のタイル302は、関連クラスタ304と電気的に通信するハブ、メモリコントローラ、及び他のデバイスに相当する。クラスタ、及びタイルは、約3mm×3mmの大きさにすることができるが、実施形態によっては、もっと大きく、又はもっと小さく作成される場合もある。本発明の実施形態が、4つのコアを有するクラスタに制限されることはない。他の実施形態において、クラスタは、2、3、及び4、又はそれ以上の数のコアを含む場合がある。クラスタ、及びタイルの一例については、図4A〜図4Bを参照し、後で説明される。オプティカルダイ108は、概ね規則正しい間隔で配置された16個の光電変換器306のような光電変換器と、ストリップ308によって表され、規則正しい間隔で配置された16個の光電変換器をそれぞれ通って蛇行する蛇行形状を有する概ね平行な(交差しない)270本の個別の導波路と、8本の概ね平行な導波路の16の束であって、各束が、光電変換器306から発出する束310のように、対応する光電変換器から発出するように構成される、8本の概ね平行な導波路の16の束とを含む。270本の蛇行導波路は、「オンチップ導波路」と呼ばれ、光電変換器間における光通信を提供し、16束の導波路を含む導波路は、「オフチップ導波路」と呼ばれ、計算装置100の外にあるデバイスとの間の光通信を提供する。16個の光電変換器はそれぞれ、4つの光電変換器ブロック(図示せず)から構成される。各光電変換器ブロック(「変換器ブロック」)は、メモリコントローラダイ104における4つの関連タイルのうちの1つと電気的に通信する。変換器ブロックの詳細については、図6、及び図7を参照し、後で説明する。アナログ電子回路ダイ106は、16個のパッチを含み、各パッチは、メモリコントローラダイ104における4つのタイルと、オプティカルダイ108における光電変換器との間に配置される。各パッチは、金属化され、又はシリコン充填されたスルーバイアを含み、それらのスルーバイアにより、メモリコントローラダイ104における4つのタイルと、対応する光電変換器との間のアナログ電気通信が可能になる。データは、アナログ電気信号(「電気信号」)の形でパッチを通して伝送される。なぜなら、アナログ信号の生成は一般に、デジタル電気信号の生成に比べて大幅に少ない電力しか消費しないからである。
【0018】
下記の説明は、オプティカルダイ108をどのように使用して、プロセッサダイ102上のクラスタ間におけるデータの伝送を可能にし、また、クラスタと外部装置との間におけるデータの伝送を可能にするかの概要を示している。クラスタ304のようなプロセッサダイ102のクラスタにより生成され、又はタイル302のようなメモリコントローラダイ104のタイルから抽出されたデータは、パッチ312におけるバイアを通して、データ符号化電気信号として、光電変換器306の対応する変換器ブロック(図示せず)へ伝送される。変換器ブロックは、それらの電気信号を、オンチップ導波路308のうちの1以上を伝搬する「チャネル」と呼ばれる電磁放射の1以上の波長として符号化する。データの未変調チャネルへの符号化は、チャネルの強度を変調することにより達成され、変調については、図14を参照して後で詳しく説明される。データを有するチャネルは、「符号化チャネル」と呼ばれる。符号化チャネルは、(1)同じ光電変換器306とも電気的に通信する隣のクラスタ314、(2)クラスタ315のように、プロセッサダイ102のどこかにあるクラスタ、又は(3)外部デバイス(図示せず)へ向かう場合がある。符号化チャネルが隣のクラスタ314へ向かう場合、光電変換器306における対応する変換器ブロックは、その符号化チャネルを受け取り、それらを符号化電気信号に変換して戻し、それをパッチ312を通してクラスタ314へ送り返す。データ符号化チャネルがクラスタ315へ向かう場合、符号化チャネルは、適当なオンチップ導波路に沿って、光電変換器316におけるクラスタ315に対応する変換器ブロックへ伝送される。符号化チャネルは、符号化電気信号に変換して戻され、それらは、パッチ318を通してクラスタ315へ伝送される。符号化チャネルが外部デバイスへ向かう場合、光電変換器306の変換器ブロックは、符号化されたチャネルを束310のオフチップ導波路に置き、符号化チャネルは、そこからオプティカルダイ108を出る。外部デバイスが4つのクラスタ314のうちの1つへ向かう符号化チャネルを生成する場合、符号化チャネルは、束310を成すオフチップ導波路に沿って光電変換器306へ伝送され、そこで、符号化チャネルは、符号化電気信号に変換され、さらなる処理のために、それらの電気信号は、パッチ312を通して4つのクラスタ314へ伝送される場合がある。動作の詳細な説明、及びオプティカルダイ108の構成要素については、図7を参照して後で説明する。
【0019】
クラスタ、及びメモリコントローラ
図4Aは、本発明の種々の実施形態によるプロセッサダイ102のクラスタ402を示している。クラスタ402は、4つのコアを含む。各コアは、L1命令キャッシュ、及びL1データキャッシュと電気的に通信する。L1命令キャッシュ、及びL1データキャッシュは、頻繁にアクセスされる命令、及びデータ、又は最近アクセスされた命令、及びデータを一時的に記憶する高速なランダムアクセスメモリである。図4Bは、本発明の種々の実施形態によるメモリコントローラダイ104の1つのタイル404を示している。タイル404は、L2キャッシュと、ハブ、メモリコントローラ、ディレクトリ、ネットワークインタフェース、自己のクロスバー接続、及びピアクロスバー接続を含むコンポーネント領域406とを含む。これらのクロスバー接続は、光電変換器の対応する部分に接続されるように構成される場合がある。L2キャッシュは、クラスタ402の4つのコアにより共有される。L1−L2インタフェース408は、クラスタ402、及びタイル404のほぼ中心に配置され、クラスタ402とタイル404の間における電気的通信を提供する。
【0020】
小型の、十分な処理能力のコア、及びキャッシュによって、単位エネルギー当たりの実現可能な最適性能に近い性能が達成される。従って、本発明のために選択されるコアは、5GHzクロックを使用することができ、コアは、dual-issueであっても、In-orderであっても、マルチスレッドであってもよく、4つの乗累算演算、及び4ワード幅の読み出し/記憶処理が可能な単一命令複数データ(「SIMD」)命令を提供するように構成される場合がある。SIMDは、浮動小数点性能を加速するように設計された複数の低レベル関数の集まりであってもよい。SIMDプロセスによれば、1つの命令で、複数のデータ片に対して同じ関数を実施することができ、データの処理に要するループ数を減らすことができる。図3を参照して上で説明したように、5GHzのクロックに従って動作するちょうど64個のクワッドクラスタを使用した場合、計算装置100の計算帯域幅は、1Tフロップ/秒になることがある。各クラスタは、「エポック」と呼ばれる24クロックサイクルの間に、64〜128バイトのような少なくとも1つのキャッシュラインを送信する場合がある。
【0021】
図5は、本発明の種々の実施形態による、図4A〜図4Bに示したクラスタ、及びタイルの構成要素間における命令を示す概略図である。ハブ502は、符号化された電気信号をL2キャッシュ504、ディレクトリ506、メモリコントローラ508、及びネットワークインタフェース510に伝送する。図3を参照して上で説明したように、ハブ502はさらに、符号化された電気信号をオプティカルダイ108の光電変換器との間でやり取りする責任も有する。ネットワークインタフェース510は、外部ネットワークとの接続を提供し、メモリコントローラ508は、L2キャッシュ504、図1に示したメモリ110〜113、及び図2に示したDIM216〜218のような外部メモリとの間で相互にやり取りされるデータの流れを管理する。
【0022】
図6は、本発明の種々の実施形態に従って構成された、プロセッサダイ102の4つのクラスタ602、メモリコントローラダイ104の対応するタイル604、アナログ電子回路ダイ106のパッチ606、及びオプティカルダイ108の光電変換器608を示す拡大分解斜視図である。図6に示すように、光電変換器608は、4つの個別の光電変換器ブロック610〜613を含む。各変換器ブロックは、パッチ606を介して、4つのタイル604のうちの1つと電気的に通信する。具体的には、タイル615は、変換器ブロック610と電気的に通信し、タイル616は、変換器ブロック611と電気的に通信し、タイル617は、変換器ブロック612と電気的に通信し、タイル618は、変換器ブロック613と電気的に通信する。変換器ブロック610〜613は、タイル615〜618のそれぞれから出力される符号化された電気信号を、他のクラスタによって処理するために、オンチップ導波路308の一部へ伝送可能な符号化されたチャネルに変換し、又は、導波路620の束を通して外部装置へ伝送し、処理する。変換器ブロック610〜613は、導波路の束620、及びオンチップ導波路308を通して伝送された符号化されたチャネルをさらに、4つのクラスタ602により個別に処理することが可能な符号化された電気信号に変換する。
【0023】
オプティカルダイ
図7Aは、本発明の種々の実施形態によるオプティカルダイ108を示す概略図である。図7Aに示すように、また、図3を参照して上で説明したように、オプティカルダイ108は、270本の概ね平行で交差しないオンチップ導波路306、16個の概ね規則的な間隔で配置された光電変換器、及び16束の8本のオフチップ導波路を含む。オンチップ導波路308は、蛇行形状を成すように構成され、270本のオンチップ導波路308を全て、16個の光電変換器のそれぞれに光学的に結合することができる。図7Aは、各光電変換器が、4つの変換器ブロックを含むことを示している。換言すれば、オプティカルダイ108は、64個の変換器ブロックを含み、変換器ブロックはそれぞれ、メモリコントローラダイ104の64個のタイルのうちの1つと通信する。また、図7Aは、2つの実質的に同一のチャネルソース702、及び704が、蛇行するオンチップ導波路308の両端に配置されることも示している。ソース702、及び704はそれぞれ、オンチップ導波路のそれぞれに対し、同じ一組の64個の異なるチャネルを逆方向に出力するように構成される。方向矢印706は、ソース704から出力されたチャネルが伝送される方向を表し、方向矢印708は、ソース704から出力されたチャネルが伝送される方向を表す。蛇行するオンチップ導波路308は、約1900μmの幅を有する。
【0024】
本発明の種々の実施形態が、図7Aに示すような蛇行形状のオンチップ導波路に制限されることはない。オンチップ導波路の構成は、任意の適当な形のものであってよく、例えば、光電変換器の数、光電変換器のレイアウト、及びオプティカルダイで利用可能な空間の数に従って変わることがある。
【0025】
図7Bは、本発明の種々の実施形態によるオプティカルダイ108の、図7Aに示した領域710の拡大を示している。図7Bに示すように、単純化のために、270本の蛇行するオンチップ導波路のうちの8本だけが描かれている。図7Bは、導波路が交差せず、導波路714、及び716のように概ね平行であることを示している。
【0026】
オンチップ導波路308は、0.25〜0.5マイクロメートルの範囲の断面寸法を有する、リッジ型導波路であってもよいし、フォトニック結晶導波路であってよい。図7Cは、本発明の種々の実施形態による図7Bにおいてライン7C−7Cに沿って切断して見たときのオンチップリッジ型導波路300の一部718を示す断面図である。図を分かりやすくするために、オンチップリッジ型導波路の図示の部分は、オプティカルダイ108の表面に配置された270本のオンチップリッジ型導波路のうちの20本に相当する。図7Cに示すように、リッジ型導波路は、複数の束を成すように配置され、束720のように、各束は4本の導波路を含む。
【0027】
図7Dは、本発明の種々の実施形態による2本の概ね平行なフォトニック結晶導波路の一部を示す平面図である。図7Dにおいて、円722のような種々の円は、オプティカルダイ108の誘電体層、又は半導体基板層における規則的格子を表している。開口部を有しない領域が、フォトニック結晶導波路724、及び726である。開口部には、空気、又は、基板層の屈折率よりも小さい屈折率を有する誘電体材料を充填することができる。開口部の規則的格子は、導波路724、及び726を取り囲む二次元ブラッグ格子を形成する。この二次元ブラッグ格子は、導波路724、及び726に対する適当な波長のERを制限する。フォトニック結晶導波路は周知であり、2005年、エルゼビア,インクのオカモト・カツナリ著の教科書「Fundamentals of Optical Waveguides」、1983年、ロンドンのスナイダー、ラブ,チャップマン、及びホール著「Optical Waveguide Theory」、及び2005年、ベルリンのジーンマイケル・ローティオズ、スプリンジャー・バーラグ著の「Photonic Crystals」は、当該分野における多数の参考文献のうちの3つに過ぎない。
【0028】
図8は、本発明の種々の実施形態によるソース702を示す概略図である。ソース702は、レーザー802、及び2つのスター・カプラ804、806を含む。レーザー802は、64個の異なる波長の未変調の電磁放射を放射するレーストラック型モード同期レーザーであってもよい。各波長、又は「チャネル」は、λ、λ、λ、・・・、λ64で表され、各チャネルは、比較的一定の強度を有する。スター・カプラ804、及び806はそれぞれ、ツリー構造を成すように構成されたビームスプリッタを含み、図8に示すように、64個のチャネルは、270本のオンチップ導波路のうちの258本のそれぞれに配置される。本発明の特定の幾つかの実施形態において、レーザー802は、M+1レーザー波長を生成するハイブリッドIII−V族半導体Siモード同期レーザである場合がある。((2007)Optic Express 15、2315のエイ・ダブリュ・ファング他著の「Integrated AlGaInAs-silicon evanescent race track laser and photodetectors」を参照)。
【0029】
オプティカルダイ108は、24クロックサイクルのエポックにおいて、同期的に動作する。利用可能な未符号化チャネルは、キャッシュライン、又はブロードキャストメッセージ、又は制御メッセージを単一のエポックにおいて送信可能な論理チャネルにグループ化される。1つの論理チャネルは、1つのエポックにおいて、一本のキャッシュライン、又は制御メッセージを伝送することができる。論理チャネルへのチャネルのグループ化は、4クロックサイクル(24クロックサイクル/6チャネル)毎に、クラスタが、最大で1本のキャッシュラインを送受信することができるような形で行われ、その結果、10Tバイト/秒(64クラスタ×(128バイト/4クロック)×5GHz)の合計帯域幅が生成される。
【0030】
光電変換器
図9A〜図9Bは、本発明の種々の実施形態による2タイプの光電変換器を示す概略図である。図9Aにおいて、第1の光電変換器900は、4つのオフチップ通信ハブ905〜908に光学的に結合された4つの変換器ブロック901〜904を含む。通信ハブ905〜908はそれぞれ、束911〜914に光学的に結合され、各束は、8つのオフチップ導波路を含む。図9Bにおいて、第2の光電変換器920は、単一のデバイス922にグループ化されたオフチップ通信ハブに光学的に結合された同じ4つの変換器ブロック901〜904を含む。導波路の束911〜914は、直列化/非直列化デバイス924を介してデバイス922に光学的に結合された導波路の束911〜914を含む。
【0031】
図10は、本発明の種々の実施形態による変換器ブロック1000の種々の構成要素を示す概略図である。変換器ブロック1000は、ブロードキャストシステム1002、データ/制御ブロック1004、調停システム1006、及びオフチップ通信ハブ1008を含む。調停システム1600の動作、及びアーキテクチャについては、図18、及び図19を参照し、後で詳しく説明される。ブロードキャストシステム1002により、関連クラスタは、データを他の全てのクラスタにほぼ同時に送信することが可能になる。データ/制御ブロック1004は、メモリコントローラダイ104の特定のタイルに専用であり、符号化されたチャネルを、特定のタイルへ送信される符号化された電気信号に変換し、タイルから出力される符号化された電気信号を、計算装置上の他のクラスタへ送信される符号化されたチャネルに変換する。データ/制御ブロック1004のアーキテクチャについては、図11〜13を参照し、後で詳しく説明される。調停システム1006は、所与のエポックにおけるクラスタ、又は導波路の束を使用する権利を、クラスタに付与する。図10に示すように、270本のオンチップ導波路308のうちの2本は、ブロードキャストシステム1002に専用であり、オンチップ導波路308のうちの12本は、調停システム1006に専用であり、オンチップ導波路308のうちの256本は、データ/制御ブロック1004に専用である。256本のオンチップ導波路は、64の束を成すように編成される。64の束はそれぞれ、メモリダイ102における特定のタイルに専用の4つのオンチップ導波路からなる。
【0032】
図10はさらに、変換器ブロック1000の種々の構成要素の寸法を表すパラメタw、w、w、w、及びwを含む。特定の幾つかの実施形態において、wは、約2100〜2400μmの範囲であり、wは、約1700〜2100μmの範囲であり、wは、約32〜44μmの範囲であり、wは、約80〜120μmの範囲であり、wは、約500〜600μmの範囲である場合がある。好ましくは、wは、約2290μmであり、wは、約1900μmであり、wは、約38μmであり、wは、約100μmであり、wは、約530μmである場合がある。ただし、これらの寸法、及び範囲は、実施形態によって変更してもよい。
【0033】
図11は、本発明の種々の実施形態によるデータ/制御ブロック1100を示す概略図である。データ/制御ブロック1100は、オプティカルダイ102における64個のデータ/制御ブロックのうちの第N番目のものに相当する。水平線1101〜1109は、64個のデータ/制御ブロックのそれぞれに関連する4本のオンチップ導波路の64の束のうちの9束のみを表す(残りの束は、図示されていない)。また、束には、上から下まで1〜64のラベルが付され、各ラベルが、特定のデータ/制御ブロックに対応している。各データ/制御ブロックは、特定の束を使用して、残りの63個のデータ/制御ブロックから出力された符号化されたチャネルを受信する。残りの63の束は、データ/制御ブロックが、符号化チャネルを他の63個のデータ/制御ブロックへ送信するために使用される。例えば、図11に示すように、データ/制御ブロック1100は、束を成す導波路変調器1110のような63の束を成す導波路変調器を有し、導波路変調器は1〜N−1までの束、及びN+1〜64までの束に光学的に結合される。データ/制御ブロック1100はさらに、第Nの束1105に光学的に結合された2つの束を成す導波路検出器1112、及び1114を有する。データ/制御ブロック1100は、ソース702、及び704からの第1〜第N−1の束、及び第N+1〜第64の束のオンチップ導波路のそれぞれにおいて、符号化されていない(すなわち、未変調の)チャネルを受け取る。
【0034】
図11に示すように、データ/制御ブロック1100は、ソース702により提供される符号化されていないチャネルを使用して、第N+1〜第64のデータ/制御ブロックに向けて送信される符号化されたチャネルを生成し、ソース704により提供される符号化されていないチャネルを使用して、第1〜第N−1のデータ/制御ブロックに向けて送信される符号化されたチャネルを生成する。例えば、図11に方向矢印1116〜1120で示されているように、データ/制御ブロック1100は、ソース704から発せられた符号化されていないチャネルを束1101〜1104において受信し、束1101〜1104に光学的に結合された束を成す導波路変調器を使用して、第1〜第N−1のデータ/制御ブロックに向けて送信されるまだ符号化されていないチャネル1112〜1125におけるデータを符号化する。一方、データ/制御ブロック1100は、方向矢印1121〜1125で示されているように、ソース702から発せられたまだ符号化されていないチャネルを束1121〜1125において受信し、束1106〜1109に光学的に結合された束を成す導波路変調器を使用して、第N+1〜第64のデータ/制御ブロックに向けて送信されるまだ符号化されていないチャネル1112〜1125におけるデータを符号化する。データ/制御ブロック1100は、束を成す導波路検出器1112、及び1114を使用し、他の63個のデータ/制御ブロックにより送信された符号化されたチャネル1120、及び1121を受信する。
【0035】
図12は、本発明の種々の実施形態によるデータ/制御ブロックを示す概略図である。図12に示すように、第2のデータ/制御ブロック1202は、第2の束1102上の符号化されたチャネルを受信するように構成され、第63のデータ/制御ブロック1204は、第63の束1108上の符号化されたチャネルを受信するように構成される。データ/制御ブロック1100、及び1204、並びに図示しない他のデータ、及び制御ブロックは、束1102を使用して、符号化されたチャネルを第2のデータ/制御ブロック1202へ送信する。これらの符号化されたチャネルは、かく乱されることなく中間に位置するデータ/制御ブロックを通過する。データ/制御ブロック1100、及び1202、並びに図示しない他のデータ、及び制御ブロックは、束1108を使用して、符号化されていないチャネルを第63のデータ/制御ブロック1204へ送信する。これらの符号化されたチャネルは、かく乱されることなく中間に位置するデータ/制御を通過する。束を成す導波路変調器、及び検出器のアーキテクチャ、及び動作については、図13、及び図14を参照して詳しく説明される。
【0036】
なお、本発明の他の実施形態において、データ/制御ブロック1100は、ソース702により提供される符号化されていないチャネルを使用して、第1〜第N−1のデータ/制御ブロックに向けて送信される符号化されたチャネルを生成し、ソース704により提供される符号化されていないチャネルを使用して、第N+1〜第64のデータ/制御ブロックに向けて送信される符号化されたチャネルを生成するように構成される場合もある。
【0037】
束を成す導波路変調器、及び束を成す導波路検出器は、ほぼ同一に構成されるデバイスである。図13は、本発明の種々の実施形態による拡大された束を成す変調器/検出器1300を示す概略図である。図11〜図12を参照して上で説明したように、束を成す導波路変調器/検出器1300は、4つのオンチップ導波路1301〜1304の束において、チャネルを受信する。束を成す導波路変調器/検出器1300は、導波路マイクロリングシステム1306のような4つの導波路マイクロリングシステムを含む。4つのマイクロリングシステムは、ほぼ平行な導波路1301〜1304を含み、導波路1301〜1304間の分離距離は、約10〜14μmにすることができ、この距離は、束を成す導波路変調器/検出器1300の外側にある束を成す導波路1301〜1304間の分離距離よりも長い。各導波路マイクロリングシステムは、マイクロリング1308のような64個のマイクロリングを含む。64個のマイクロリングは、各導波路の長手方向に沿って、導波路の両側に近接して分散配置される。各マイクロリングは、光学的に結合された導波路に沿って伝送される64個のチャネルのうちの一つと共振するように構成される。マイクロリングの構成については、図17を参照して以下で説明される。
【0038】
図13は、導波路マイクロリングシステム1300の種々の構成要素を表すパラメタt、t、t、及びtをさらに含む。一部の特定の実施形態において、tは、約45〜65μmの範囲とされ、tは、約200〜300μmの範囲とされ、tは、約0.5〜5μmとされ、tは、約1〜10μmとされる場合がある。好ましくは、tは、約57.7μmとされ、tは、約255μmとされ、tは、約2μmとされ、tは、約5μmとされる。ただし、本発明が、それらの寸法、又は寸法範囲に限定されることはない。それらの寸法、及び寸法範囲は、実施形態によって異なる場合がある。
【0039】
図14は、本発明の種々の実施形態によるオフチップ通信ハブ400を示している。オフチップ通信ハブ1400は、オフチップ導波路変調器1401、及びオフチップ導波路検出器1402を含み、約200〜300μm×約100〜200μmの総寸法を有する。ただし、寸法は、実施形態によって異なる場合がある。オフチップ導波路変調器1401は、4つの導波路マイクロリングシステム1403〜1406を含む。導波路マイクロリングシステム1403〜1406はそれぞれ、オフチップ導波路、及び64個のマイクロリングを含む。導波路マイクロリングシステム1403〜1406の導波路は、4つのビームスプリッタ1408〜1411を介してオンチップ導波路1407にそれぞれ光学的に結合される。導波路1407は、ビームスプリッタ1408〜1411によって導波路マイクロリング1403〜1406の中に置かれた64個の符号化されていないチャネルを有し、その後、導波路マイクロリングシステム1403〜1406は、図15を参照して後で説明するように、4つの対応するタイルにより生成された64個の符号化されていないチャネルにデータを符号化するために使用される。オフチップ導波路検出器1402は、4つの導波路マイクロリングシステム1412〜1415を含み、それらはさらに、オフチップメモリのような外部デバイスから符号化されたチャネルを受け取るための4つのオフチップ導波路を含む。導波路マイクロリングシステム1412〜1415は、符号化されたチャネルを、4つの電気的結合タイルへ送信される対応する符号化された電気信号に変換するために使用される。
【0040】
図15は、本発明の種々の実施形態によるブロードキャストシステム1500を示している。ブロードキャストシステム1500は、ブロードキャスト変調器1502、及びブロードキャスト検出器1504を含み、約400〜600μm×20〜40μmの面積寸法を有する。ブロードキャスト変調器1502は、オンチップ導波路1510、及び1512にそれぞれ光学的に結合された2つの導波路マイクロリングシステム1506、及び1508を含む。ブロードキャスト検出器1504は、ビームスプリッタ1518を介して導波路1510、及び1512にそれぞれ光学的に結合された2つの導波路マイクロリングシステム1514、及び1516を含む。ブロードキャストシステム1500は、他の全てのクラスタとの間で、データをほぼ同時に送受信するために使用される。
【0041】
なお、本発明の光電変換器実施形態について、上で、図9〜図15を参照して説明したが、本発明の64クラスタ計算装置実施形態が、そのように制限されることはない。任意数のクラスタを有する計算装置を許容するために、それらの実施形態を拡大縮小してもよいことは、当業者には直ぐに分かるであろう。
【0042】
導波路マイクロリングシステムの動作
図16Aは、本発明の種々の実施形態による、64個の符号化されていないチャネルにおいてデータを符号化するために使用可能な導波路マイクロリングシステムを示している。図16Aにおいて、導波路1602は、64個の符号化されていない(すなわち、未変調の)チャネルλ、λ、λ、・・・、λ64を有する。64個のマイクロリングはそれぞれ、チャネルの1つと共振するように構成され、その結果、各チャネルは、関連する隣りのマイクロリングへのエバネッセント結合を介して抽出することができる。例えば、マイクロリング1604は、チャネルλと共振するように構成される。チャネルλが導波路1602に沿って伝送されるのに従って、チャネルλの多くは、マイクロリング1604にエバネッセント結合される。「オン」、及び「オフ」電圧のパターンをマイクロリングに印加することによって、情報をチャネルの強度として符号化することができる。電圧は、マイクロリングの屈折率をシフトさせ、次いで、導波路1602に沿って伝送されるチャネルの強度を変調する。電圧パターンは、メモリコントローラダイ104における対応するタイルから出力される一連のデータに対応する場合がある。例えば、メモリコントローラダイ104のタイルにより生成される適当な「オン」電圧は、二進数「1」に対応し、「オフ」電圧は、二進数「0」に対応する場合がある。マイクロリングに「オン」電圧が印加されると、マイクロリングの共振はシフトされ、隣の導波路に沿って伝送される対応するチャネルは、マイクロリングにエバネッセント結合されない。換言すれば、「オン」電圧を印加している間は、チャネルがマイクロリングを通過するため、チャネルの強度は比較的変更されないままに留まる。ただし、電圧が「オフ」に切り替わると直ぐに、チャネルはマイクロリングにエバネッセント結合され、マイクロリングを通るチャネルの強度は、低下する。その結果、「オン」、及び「オフ」電圧のパターンとして符号化された同データは、チャネルの強度として符号化され、比較的強い強度は、二進数「1」に対応し、比較的弱い強度は、二進数「0」に対応する場合がある。
【0043】
図16Bは、本発明の種々の実施形態による、導波路から64個の符号化されていないチャネルを抽出するために使用可能な導波路マイクロリングシステムを示している。図16Bにおいて、64個の符号化されたチャネル:
【0044】
【数1】

【0045】
は、検出器ブロックの導波路1606に入力される。64個のマイクロリングはそれぞれ、64個のチャネルのうちの1つと共振するように構成され、各チャネルは、隣のマイクロリングへのエバネッセント結合により、抽出される。例えば、符号化されたチャネル
【0046】
【数2】

【0047】
は、導波路1606に沿って伝送され、チャネル
【0048】
【数3】

【0049】
に関連する強い強度、及び弱い強度は、マイクロリング1608にエバネッセント結合する。チャネル
【0050】
【数4】

【0051】
に関連する比較的強い強度、及び弱い強度のパターンは、マイクロリング1608にわたる高電圧、及び低電圧の対応するパターンを形成する。その後、この電圧パターンは、同情報を符号化する電気信号として、メモリコントローラダイ104における関連タイルへ送信される。
【0052】
マイクロリング
図17は、本発明の種々の実施形態によるマイクロリング1700を示す概略図である。マイクロリング1700は、導波路1702の直ぐ近くに配置される。一部の実施形態において、マイクロリング1700は、真性半導体からなり、マイクロリング1700の半導体基板内部に形成されたp形半導体領域1704、及びマイクロリング1700の外側を取り囲む、導波路1702の反対側に配置される半導体基板に形成されたn形半導体領域1706を含む。領域1704、1706、及びマイクロリング1700は、p−i−n結合を形成し、図16を参照して上で説明したように、このp−i−n結合は、フォトダイオード、又は変調器として使用することができる。図13〜図15を参照して上で説明したように、導波路1702は、オンチップ導波路であってもよいし、オフチップ導波路であってもよい。導波路1702の伝送は、チャネル波長の影響を受けることがあり、チャネルがマイクロリング1700と共振している場合、チャネルは、マイクロリング1700にエバネッセント結合するので、導波路1702の伝送は大幅に減少する場合がある。マイクロリング1700の共振は、領域1704、及び1706に適当な電圧、又は電流を印加することにより、電気的に調節することができる。マイクロリング1700は、マイクロリングに何も電圧、又は電流が印加されないときに、特定のチャネルがマイクロリング1700と共振し、マイクロリング1700にエバネッセント結合するように構成される場合がある。適当な電圧又は電流をマイクロリング1700に印加すると、マイクロリング1700の共振はシフトされ、同チャネルは、妨げられることなく導波路1702を通って伝搬する。一方、マイクロリング1700は、マイクロリング1700に電圧、又は電流が印加されたときに、特定のチャネルがマイクロリング1700と共振し、マイクロリング1700とエバネッセント結合するようにも構成することができる。電圧、又は電流を「オフ」にすると、マイクロリング1700の共振はシフトされ、同チャネルは、妨げられることなく導波路1702を通して伝搬する。マイクロリング変調器の例として、キュー.シュー他による「12.5 Gbit/s carrier-injection-based silicon microring silicon modulators」、Optics Express 15, 430(2007)を参照して欲しい。
【0053】
調停
クラスタは、リソースとして動作するだけでなく、他のリソースを要求する要求手段としても動作する場合がある。ただし、同じエポックにおいて、2以上のクラスタが特定のクラスタのような同じリソースへのアクセスを要求することがある。本発明の各クラスタは、そのような競合を避けるために、対応する調停システムに電気的に結合される。説明を短縮し、分かりやすくするために、調停の実施に関する下記の説明は、本発明の種々の実施形態による4つのクラスタのみを有する例示的な計算装置の概略図を使用して説明される。その後、調停システム実施形態に関する説明が、図19を参照してなされる。
【0054】
図18Aは、本発明の種々の実施形態による例示的な4クラスタ積層型計算装置1800を示す概略図である。計算装置1800は、4つのクラスタ1801〜1804を含み、それらは、4つの対応するデータ/制御ブロック1805〜1808と電気的に通信する。計算装置1800は、第1のソース1810、及び第2のソース1812をさらに含む。ソース1810、及び1812は、図8を参照して上で説明したように、導波路1814〜1817の4つの束の各導波路に対し、64の符号化されていないチャネルλ1、λ2、λ3、・・・、λ64を放射するように構成される場合がある。データ/制御ブロックはそれぞれ、特定の束におけるデータチャネル、及び制御チャネルを受信し、残りのチャネルを使用して、データチャネル、及び制御チャネルを他のクラスタへ送信する。例えば、データ/制御ブロック1806は、束を成す導波路復調器1820、及び3つの束を成す導波路変調器1821〜1823を含み、それらは、図11〜12を参照して上で説明したように構成され、動作する。クラスタ1801〜1804はそれぞれ、調停システム1830と電気的に通信する。
【0055】
図18Bは、本発明の種々の実施形態による調停システム1830を示す概略図である。調停システム1830は、ソース1830に光学的に結合されたパワー導波路1832、及び、4つのマイクロリング1837〜1840を介してパワー導波路1832と光通信するループ導波路1836を含む。調停システム1830は、ループ導波路1836の中に配置された4群の4つの内部マイクロリング1841〜1844をさらに含む。ソース1834は、パワー導波路1832に対し、4つの未変調チャネルλ’、λ’、λ’、λ’を放射する。各マイクロリング群1841〜1844は、4つのクラスタ1801〜1804のうちの1つと電気的に通信する。具体的には、マイクロリング群1841のマイクロリングは、クラスタ1(1801)と電気的に通信し、マイクロリング群1842のマイクロリングは、クラスタ2(1802)と電気的に通信し、マイクロリング群1843のマイクロリングは、クラスタ3(1803)と電気的に通信し、マイクロリング群1844のマイクロリングは、クラスタ4(1804)と電気的に通信する。図17を参照して上で説明したように、内部マイクロリングは、p−i−n結合フォトダイオードとして構成される。なお、64クラスタの計算装置100の場合、図19を参照して後述するように、独立したソース1834は必要ない。
【0056】
図18Bに示すように、4つのマイクロリング1837〜1840、及び内部マイクロリング1841〜1844には、それぞれチャネル指定λ’、λ’、λ’、λ’がラベル付けされる。これらの指定は、チャネルを識別し、各マイクロリングは、隣の導波路と共振し、かつ、隣の導波路からエバネッセント結合されることができる。例えば、各マイクロリング1834〜1844は、チャネルλ’、λ’、λ’、λ’のうち1つのみと共振するように個別に構成される。具体的には、マイクロリング1837〜1840は、チャネルλ’、λ’、λ’、λ’を、パワー導波路1832における時計回りの方向1846からそれぞれ、ループ導波路1836における逆時計回り方向1848にエバネッセント結合する。
【0057】
同様にして、内部マイクロリング1841〜1844はさらに、ループ導波路1836からの特定の導波路をエバネッセント結合するが、内部マイクロリングは、対応するクラスタによって駆動され、すなわち「オン」に切り替えられなければならない。例えば、マイクロリング1841は全て、チャネルλ’、λ’、λ’、λ’の共振周波数のモードオフの1/2になるように構成される場合がある。その結果、チャネルλ’、λ’、λ’、λ’は、妨げられることなくループ導波路1836を介してマイクロリング1841を通過する。しかしながら、対応するクラスタ1(1801)は、特定のマイクロリングを駆動する適当な電流を送り、マイクロリングを関連チャネルと共振する状態へ移行させることができる。その後、マイクロリングは、ループ導波路1836からのチャネルを結合し、マイクロリングの中で共振させることができる。例えば、クラスタ1(1801)は、マイクロリング1850を「オン」に切替えることができ、その結果、チャネルλ’は、ループ導波路1836からエバネッセント結合され、マイクロリング1850の中で共振する。グループ1841の中の他のマイクロリングが「オン」に切り替えられない限り、チャネルλ’、λ’、λ’、λ’は、妨げられることなく通過する。
【0058】
次に、調停システム1830を利用した、4つのクラスタ1801〜1804のうちの1つがデータ受信に利用可能であるか否かの判断について、図18A、及び図18Bを参照して説明する。各エポックの直前に、各クラスタに、ソース1834から放射される4つのチャネルのうちの1つが割当てられ、クラスタ1801〜1804は、クラスタ−チャネル間の割当てを認識する。こうした割当ては、ランダムであってもよいし、クラスタの適正な使用を確保する方法に基いて決定されてもよく、新たなエポックが開始される前のそのエポック(例示的実施形態として、エポックの1/3)の間に行うことができる。このようなクラスタ−チャネル割当ては、どのクラスタがさらなる処理のためのデータの受信に利用可能であるかを、クラスタが判断する際に使用される。一実施形態において、1つのエポック当たりのチャネル割当ては、最初に予め決定され、各クラスタにおけるアクセス可能なルックアップテーブルに記憶され、1つのエポック当たりのクラスターチャネル割当ては、ある方式に従ってコンピュータロジックにより更新される場合がある。そうした方式の一例は、ラウンドロビン方式である。
【0059】
一実施形態において、調停手段は、複数のダイに分散される。メモリコントローラダイ104上のクロスバー接続によって、調停手段に何を要求すべきかが決まる。要求は、アナログダイ106を通してオプティカルダイ108へ伝送され、オプティカルダイ108には、リング変調器、及び導波路が配置される。オプティカルダイ108において成されるこの試みは、チャネルを転向するためのものであり、チャネルは、転向され、検出される場合もあれば、されない場合もある。結果として得られる電気信号は、チャネルをクロスバー接続へと戻し、当該クロスバー接続が、次のエポックにおいてデータを変調器へ送信することにより、その電気信号を、その論理チャネルを使用するものとして、又は使用しないものとして解釈する。
【0060】
ここで、例えば、表1に示すようなエポック開始前のクラスタ−チャネル割当てについて考えて欲しい。
【0061】
【表1】

【0062】
表Iに示されているように、クラスタ1(1801)には、チャネルλ’が割当てられ、クラスタ2(1802)には、チャネルλ’が割当てられ、以下同様に割当てられている。クラスタ1(1801)、及びクラスタ4(1804)が両方とも、データ処理のためにクラスタ3(1803)を使用したいものと仮定する。図18Bへ戻り、クラスタ1(1801)は、マイクロリング1850を「オン」に切替え、クラスタ4(1804)はさらに、マイクロリング1852を「オン」に切替える。チャネルλ’は、マイクロリング1839を介してパワー導波路1832からループ導波路1836にエバネッセント結合された後、マイクロリング1839の直後から、チャネルλ’は、ループ導波路1836を反時計周りの方向1848へ進行する。マイクロリング1850は、チャネルλ’がマイクロリング1852に到達する前に、ループ導波路1836から、チャネルλ’を抽出する。マイクロリング1850において共振するチャネルλ’は、クラスタ1(1801)へ送信される電気信号を生成する。図18Aに戻り、もしこの電気信号が、閾値を超える場合、その電気信号は、クラスタ1(1801)において検出される。この信号が検出された後、クラスタ1(1801)は、次のエポックの間に、そのデータを変調器1856へ伝送し、変調器1856は、そのデータを、ソース1810から出力された未変調チャネルに符号化する。その後、それらの符号化された(すなわち、変調された)チャネルは、束1816に沿って検出器1858へと流し込まれ、図12を参照して上で説明したように、クラスタ3(1803)によって処理される。この特定のエポックにおいて、クラスタ1(1801)は、クラスタ3(1803)にアクセスし、クラスタ4(1804)は、次のエポックを待たなければならない。
【0063】
次に、クラスタ1(1801)、及びクラスタ4(1804)が両方とも、再び、データ処理のためにクラスタ3(1803)を使用したいものと仮定する。ただしこの場合、クラスタ−チャネル間の割当ては、エポックの開始前に表2に示すようなものあるものと仮定する。
【0064】
【表2】

【0065】
表2に示されているように、クラスタ3(1803)には、今度は、チャネルλ’が割当てられている。図18Bに戻り、クラスタ1(1801)は、マイクロリング1860を「オン」に切替え、クラスタ4(1804)はさらに、マイクロリング1862を「オン」に切替える。チャネルλ’は、マイクロリング1840を介してパワー導波路1832からループ導波路1836にエバネッセント結合された後、マイクロリング1840の直後から、チャネルλ’は、ループ導波路1836を反時計周りの方向へ進行する。ただし、このエポックの前に、マイクロリング1862は、チャネルλ’がマイクロリング1860に到達する前に、ループ導波路1836からチャネルλ’を抽出する。チャネルλ’は、マイクロリング1862において共振し、クラスタ4(1804)へ送信される電気信号を生成する。次に、図18Aに戻り、この電気信号が閾値を超えた場合、クラスタ4(1804)は、この信号を検出する。この信号が検出された後、クラスタ4(1804)は、上記のように、次のエポックの間にデータを更なる処理のためにクラスタ3(1803)へ送信する。この特定のエポックにおいて、クラスタ4(1804)は、クラスタ3(1803)にアクセスし、クラスタ(1801)は、次のエポックを待たなければならない。
【0066】
図19は、本発明の種々の実施形態による関連クラスタNに対応する調停システム1900を示している。調停システムは、8個の調停手段1901〜1908を含む。各調停手段は、導波路−マイクロリングシステムと、4つの中央導波路のうちの1つに光学的に結合されたマイクロリングとを含む。例えば、調停手段1901は、導波路−マイクロリングシステム1916と、中央導波路1911に光学的に結合されたマイクロリング1918とを含む。調停手段1901は、要求されたクラスタMが、データの受信に使用可能であるか否かを判断するために、クラスタNによって使用され、同じ導波路1920に接続された他の調停手段(図示せず)も、それぞれ関連するクラスタに対し、同じ事を行う。
【0067】
単純化のために、調停システム1900は、図10に示された調停システム1006のような、計算装置100の64個の調停システムのうちの1つを表すものと仮定する。64個のクラスタが全て、導波路1920に接続された調停手段を使用して、どのクラスタがデータの受信に利用可能であるかを判断するものと仮定する。ソース702、又は704のようなソースは、64個のチャネルλ、λ、λ、・・・、λ64を方向1922の向きで導波路1911の中に置く。各調停手段は、マイクロリング1918のようなマイクロリングを含み、パワー導波路1911からチャネルλ、λ、λ、・・・、λ64のうちの1つを抽出し、対応するチャネルを導波路1920に入れ、方向1924に伝搬させる。例えば、マイクロリング1918は、パワー導波路1911からチャネルλを抽出するように構成される場合がある。導波路−マイクロリングシステム1916の64個のマイクロリングはそれぞれ、適当な電流が印加されたときに、導波路1920が保持する未変調のチャネルλ、λ、λ、・・・、λ64のうちの1つを抽出するように構成される。次に、クラスタNが、次のエポックの間に処理すべきデータを、クラスタMへ送信したいものと仮定する。前のエポックの最後から1/3の間に、クラスタNは、クラスタ−チャネル間割当てにおいてチャネルλ63がクラスタMに割当てられているものと判断する。クラスタNは、マイクロリング1922を「オン」に切替えることにより、これに応答する。なぜなら、マイクロリング1918は、チャネルλのみを抽出するように構成され、チャネルλ63は、導波路1920に接続された別の調停手段(図示せず)によってパワー導波路1911から抽出され、チャネルλ63は、導波路1920に沿って方向1924の向きに送信して戻されるからである。もし仮に、チャネルλ63が、クラスタMを使用したデータ処理も行おうとするクラスタの調停手段によって捕捉されなかった場合、チャネルλ63は、マイクロリング1922へのエバネッセント結合により抽出され、マイクロリング1922は、電気信号上閾値を生成する。クラスタNは、図12を参照して上で説明したように、データをクラスタMへ送信することによって応答する。もし、チャネルλ63が、マイクロリング1922に到達する前に他のクラスタKにより抽出された場合、クラスタKは、データをクラスタMへ送信して処理することができ、クラスタNは、次のクラスタ−チャネル間割当て、及び次のエポックを待つ。
【0068】
8つの調停手段1901〜1908のうちの1つの動作について説明したが、多数の他の調停手段を使用して、他のクラスタが利用可能であるか否かを判断することができ、また、外部装置が利用可能であるか否かを判断することもできる。これらの判断は、エポック内の異なる時刻において行われる場合がある。
【0069】
上記のように、本光配線は、マルチコア計算装置の例の他に、例えば、三次元スタック、及び複数のメモリコントローラを有することが可能なメモリシステムデバイスのような他のコンピュータシステムデバイスにおいて実施することもできる。
【0070】
上記の説明では、説明の都合上、本発明を完全に理解してもらうために、特定の用語を使用した。しかしながら、当業者には明らかなように、本発明を実施する上で、特定の詳細は必要とされない。本発明の特定の幾つかの実施形態に関する上記の説明は、図示説明の目的で提供したものである。それらは、本発明を網羅することも、本発明を開示した特定の実施形態に厳密に制限することも意図していない。当然ながら、上記の教示に照らして、多数の修正、及び変形が可能である。実施例は、本発明の原理を最も良好に説明し、それによって当業者が、想定する特定の用途に適合するようにて変更を加えて本発明、及びその種々の実施形態を最良の形で利用できるようにする目的で図示説明されている。本発明の範囲は、下記の特許請求の範囲、及びその均等により定められる。

【特許請求の範囲】
【請求項1】
基板の表面に配置された複数のオンチップ導波路(308)と、
前記基板の前記表面に配置された複数のオフチップ導波路(310, 620)と、
前記基板の前記表面に配置された少なくとも1つの光電変換器(306)と
を含み、前記少なくとも1つの光電変換器が、前記複数のオンチップ導波路(308)の一部、及び前記複数のオフチップ導波路(310, 620)の一部に光学的に結合され、かつ少なくとも1つのコンピュータシステム構成要素(615-618)と電気的に通信する、光配線(108)。
【請求項2】
前記基板の前記表面に配置され、前記オンチップ導波路のそれぞれの第1の端部に結合された第1のソース(702)と、
前記基板の前記表面に配置され、前記オンチップ導波路のそれぞれの第2の端部に結合された第2のソース(704)と
をさらに含む、請求項1に記載の光配線。
【請求項3】
前記第1のソース(702)、及び前記第2のソース(704)は、
複数のチャネルを放射するように構成されたレーザー(802)と、
前記レーザーに光学的に結合され、前記複数のチャネルを受信し、前記複数のチャネルを前記オンチップ導波路のそれぞれに出力するように構成された少なくとも1つのスター・カプラ(804, 860)と
をさらに含む、請求項2に記載の光配線。
【請求項4】
前記複数のオンチップ導波路、及び前記複数のオフチップ導波路は、概ね平行なリッジ型導波路(720)、又は概ね平行なフォトニック結晶導波路(724, 726)をさらに含む、請求項1に記載の光配線。
【請求項5】
前記複数のオフチップ導波路の一部に光学的に結合され、少なくとも1つのチャネルを送受信するように構成された少なくとも1つの光ファイバ(124, 126)配線をさらに含む、請求項1に記載の光配線。
【請求項6】
前記少なくとも1つの光電変換器(306)は、前記少なくとも1つのコンピュータシステム構成要素と電気的に通信する少なくとも1つの光電変換器ブロック(901-904)をさらに含む、請求項1に記載の光配線。
【請求項7】
前記少なくとも1つの光電変換器ブロックは、
オンチップ導波路に光学的に結合され、前記少なくとも1つのコンピュータシステム構成要素により生成されたデータ符号化電気信号に従って複数のチャネルを変調し、少なくとも1つのオフチップ導波路を介して符号化されたチャネルを受信し、前記符号化されたチャネルを、前記少なくとも1つのコンピュータシステム構成要素によって処理するために、データ符号化電気信号に変換するように構成されたオフチップ通信ハブ(1800, 1400)と、
前記複数のオンチップ導波路の第1の部分に光学的に結合され、前記複数のオンチップ導波路の第1の束に沿って伝送された複数の未変調のチャネルを受信、及び変調し、前記複数のオンチップ導波路の第2の束に沿って伝送された複数の符号化されたチャネルを受信し、前記少なくとも1つのコンピュータシステム構成要素によって処理するために、対応するデータ符号化電気信号を生成するように構成されたデータ/制御ブロック(1004, 1100, 1805-1808)と、
前記複数のオンチップ導波路の第2の部分に光学的に結合され、コンピュータシステム構成要素間におけるデータの分配を管理するように構成された調停システム(1006, 1830, 1900)と、
前記複数のオンチップ導波路の第3の部分に光学的に結合され、他の全てのコンピュータシステム構成要素との間でデータをほぼ同時に送受信するように構成されたブロードキャストシステム(1002, 1500)と
をさらに含む、請求項6に記載の光配線。
【請求項8】
前記少なくとも1つの光電変換器は、
少なくとも1つの導波路(1301, 1602, 1606, 1702)と、
前記少なくとも1つの導波路に光学的に結合された複数のマイクロリング(1308, 1604, 1608, 1700)であって、各マイクロリングが、前記少なくとも1つの導波路を通して伝送される複数のチャネルのそれぞれのチャネルと共振するように構成される、複数のマイクロリング(1308, 1604, 1608, 1700)と
をさらに含む、請求項1に記載の光配線。
【請求項9】
前記導波路に光学的に結合された前記複数のマイクロリングは、前記導波路に隣接して配置された前記複数のマイクロリングの第1の部分、及び前記導波路に隣接して配置された前記複数のマイクロリングの第2の部分をさらに含む、請求項8に記載の光配線。
【請求項10】
各マイクロリングは、前記マイクロリング内に配置されたn型半導体領域、及び前記マイクロリング内に配置されたp型半導体領域をさらに含み、又は、前記マイクロリング内に配置されたp型半導体領域、及び前記マイクロリング内に配置されたN型半導体領域をさらに含む、請求項8に記載の光配線。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図7C】
image rotate

【図7D】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16A】
image rotate

【図16B】
image rotate

【図17】
image rotate

【図18A】
image rotate

【図18B】
image rotate

【図19】
image rotate


【公表番号】特表2011−501238(P2011−501238A)
【公表日】平成23年1月6日(2011.1.6)
【国際特許分類】
【出願番号】特願2010−531044(P2010−531044)
【出願日】平成20年10月23日(2008.10.23)
【国際出願番号】PCT/US2008/012098
【国際公開番号】WO2009/055018
【国際公開日】平成21年4月30日(2009.4.30)
【出願人】(503003854)ヒューレット−パッカード デベロップメント カンパニー エル.ピー. (1,145)
【Fターム(参考)】