Co uniemożliwia budowę procesora z całą niezbędną pamięcią reprezentowaną w rejestrach?

user173317

2019-03-04 10:25:24 UTC

view on stackexchange narkive permalink

Nowoczesne procesory wykorzystują hierarchię technologii pamięci. Rejestry wbudowane w chip mają najkrótsze czasy dostępu, ale są drogie i niestabilne. Pamięć podręczna jest pośrednikiem między pamięcią RAM a rejestrami do przechowywania struktur danych w celu zmniejszenia opóźnień między pamięcią RAM a rejestrami. Pamięć RAM zawiera, dla zakresu tego zapytania, aktywny kod programu i jego struktury danych. Pamięć nieulotna jest używana przez programy do zapisywania danych i przechowywania systemu operacyjnego i jego programów.

Opóźnienie dostępu do danych w pamięci było głównym wąskim gardłem w tworzeniu szybszych procesorów, które nie pozostają bezczynne, oczekując na dalsze instrukcje. W związku z tym zaprojektowano różne metody zrównoleglania obciążeń, procesory CPU do przewidywania rozgałęzień w celu ukrycia narzutu dostępu do pamięci i nie tylko. Jednak złożoność tego pozornie zignorowała inną możliwość: plik rejestru całej pamięci.

Taki procesor jest zbudowany z 4, 8, 16, 32 GB lub więcej, zbudowanych z rejestrów. Brak pamięci podręcznej. Brak pamięci RAM. Tylko procesor, rejestry w chipie i zewnętrzna pamięć nieulotna (SSD / Flash, HDD itp.).

Rozumiem, że popyt na taki chip raczej nie będzie wystarczający, aby uzasadnić koszt, ale jestem zaskoczony, że nikt nie zaprojektował prostego urządzenia, takiego jak wysokowydajny MCU lub SoC z niewielką ilością pamięci tylko rejestrowej. Czy istnieją inne (być może techniczne) wyzwania związane z projektowaniem i budową takiego chipa?

EDYTUJ, aby wyjaśnić. Nie mam na myśli procesora, w którym cała pamięć (technologia DRAM) jest zintegrowana z kością procesora, ani nie odnoszę się do pamięci podręcznej rozszerzonej do wielu gigabajtów. Pytam o projekt, w którym rejestry pozostają ich istniejącą technologią ... po prostu rozbudowane o kilka rzędów wielkości, aby móc przechowywać wiele gigabajtów danych.

Jaka aplikacja, o której myślisz, wymaga tak niesamowitej szybkości, ale bardzo małej pamięci?Myślę, że jest też dużo więcej obwodów pomocniczych dla każdego rejestru niż dla SRAM.Najbliższą rzeczą jest prawdopodobnie FPGA.

Konstrukcja procesora SPARC pozwala na około 520 rejestrów.Dzielą to na różne „okna”, które są mniejszymi częściami tego.(Nawiasem mówiąc, nie znam żadnego SPARC, który implementowałby wszystkie 520, tak przy okazji.) Implementacja dwuportowych rejestrów do odczytu / zapisu jest kosztowna.A te muszą działać z pełną szybkością zegara.Większe układy pamięci wymagają więcej czasu i szybko przekraczają częstotliwość zegara, co wymaga opóźnień.W pewnym momencie jesteś z powrotem w systemie pamięci podręcznej.Możesz zorganizować szybszą pamięć podręczną L1 (mniejszą) z mniejszymi opóźnieniami taktowania z dodanymi L2 i L3 z dłuższymi układami.

Czy próbowałeś oszacować, ile sprzętu logicznego i miejsca na krzem będzie potrzebne, aby zaadresować (i uzyskać dostęp) do 32 GB rejestrów indywidualnie?A jakie byłoby związane z tym opóźnienie dostępu?

Cała pamięć zajmuje miejsce.Rejestry są pamięcią.Im więcej miejsca zajmujesz na rejestry, tym dalej są one oddalone od reszty rdzenia.Dzięki temu rozmowa z nimi będzie wolniejsza.

Jedynym powodem jest dość wysoki koszt.Aby to zrobić, potrzebujesz procesora wielkości talerza obiadowego, który kosztuje kilka milionów dolarów za sztukę, chłodzi ciekłym azotem, zużywa kilka kilowatów i również działa bardzo wolno.Czemu?Ponieważ każda instrukcja ma teraz trzy pola do adresowania rejestrów, każda 64-bitowa plus opkody, masz ponad 200-bitowe słowo instrukcji.

Ale wiem, że AVR faktycznie to zrobił: zapakował 512 słów pamięci jako SRAM, a plus bezpośrednie adresowanie pamięci, te SRAM są efektywnie rejestrami.Więc jest to rzeczywiście możliwe i zostało zrobione.

Jakie rejestry masz na myśli, które są szybsze niż 1600 MHz 1 czekaj na odczyt w 8 GB SDRAM?Jaki system operacyjny, jeśli w ogóle, będzie wspierać Twoją koncepcję?Koszt statycznej pamięci RAM procesora nie jest możliwy do uzasadnienia przyrostowej przepustowości taniej szybkiej pamięci SDRAM.Niektóre procesory mają teraz pamięć podręczną L1, L2 i L3

@user3528438 Nie. Oto jak zdefiniować rejestr: „lokalizacja pamięci, bezpośrednio dostępna dla CPU, która może być używana jako argumenty dla instrukcji”.A „instrukcje” oznaczają coś więcej niż tylko ładowanie / przechowywanie: bardziej przypomina na przykład wykonywanie operacji arytematycznych.Na 512 bajtach pamięci RAM w AVR nie można bezpośrednio wykonywać operacji arytmetycznych: te bajty nie są bezpośrednio połączone z procesorem.Musisz załadować dane z pamięci RAM do rzeczywistych rejestrów, a następnie wykonać instrukcje arytmetyczne na rejestrach.Wewnętrzna pamięć RAM w MCU nie jest zestawem rejestrów, nawet jeśli znajduje się w tym samym chipie.Nadal jedzie przez autobus.

Chipy PIC16 nazywają również wszystkie dostępne rejestry pamięci, dając kilka kilobajtów.Nie obsługują bezpośrednio pamięci zewnętrznej.

@dim: A co, jeśli masz instrukcję, która w zasadzie łączy ładowanie + inną operację + przechowywanie?Myślę, że żadne twarde rozróżnienie nie jest możliwe.Tradycyjnie ISA używają rejestrów procesora, ale w zasadzie są one bezpośrednio kontrolowaną pamięcią podręczną L0.

@Michael Tak naprawdę nic nie zmienia, jeśli istnieje instrukcja, która pozwala na połączenie pobrania wartości z pamięci + wykonanie na niej operacji arytmetycznej.Procesor x86 ma takie instrukcje, ale czy nadal miałoby sens rozważenie 16 GB pamięci DDR SDRAM za gigantyczny zestaw rejestrów?Chodzi o to, że nawet jeśli procesor je łączy, musi wykonać pobieranie, które przechodzi przez magistralę pamięci, zarządzane przez interfejs pamięci po stronie procesora, a następnie przechodzi przez arbitraż, a następnie dekoduje adres po stronie pamięci RAM itp... wszelkiego rodzaju rzeczy, które nie są potrzebne do uzyskania dostępu do rejestru.

Użyłem bardzo low-endowego układu PIC z 32 8-bitowymi rejestrami i bez jakiejkolwiek dodatkowej pamięci.Wspierał pośrednie adresowanie do tych rejestrów.