Ma ṣe Jẹ ki Ibi ipamọ Di Bottleneck bọtini ni Ikẹkọ Awoṣe

O ti sọ pe awọn ile-iṣẹ imọ-ẹrọ boya n pariwo fun awọn GPU tabi ni ọna lati gba wọn. Ni Oṣu Kẹrin, Alakoso Tesla Elon Musk ra 10,000 GPUs ati sọ pe ile-iṣẹ yoo tẹsiwaju lati ra opoiye ti GPUs lati NVIDIA. Ni ẹgbẹ ile-iṣẹ, oṣiṣẹ IT tun n titari lile lati rii daju pe awọn GPU nigbagbogbo nlo lati mu ipadabọ pọ si lori idoko-owo. Sibẹsibẹ, diẹ ninu awọn ile-iṣẹ le rii pe lakoko ti nọmba awọn GPU n pọ si, iṣiṣẹ GPU di pupọ sii.

Ti itan ba ti kọ wa ohunkohun nipa iširo iṣẹ-giga (HPC), o jẹ pe ibi ipamọ ati nẹtiwọọki ko yẹ ki o rubọ laibikita fun idojukọ pupọ lori iṣiro. Ti ibi ipamọ ko ba le gbe data daradara si awọn ẹya iširo, paapaa ti o ba ni awọn GPU julọ julọ ni agbaye, iwọ kii yoo ṣaṣeyọri ṣiṣe to dara julọ.

Gẹgẹbi Mike Matchett, oluyanju ni Kekere World Big Data, awọn awoṣe kekere le ṣee ṣe ni iranti (Ramu), gbigba idojukọ diẹ sii lori iṣiro. Sibẹsibẹ, awọn awoṣe ti o tobi bi ChatGPT pẹlu awọn ọkẹ àìmọye awọn apa ko le wa ni ipamọ ni iranti nitori idiyele giga.

"O ko le baamu awọn ọkẹ àìmọye awọn apa ni iranti, nitorina ibi ipamọ di paapaa pataki diẹ sii," Matchett sọ. Laanu, ibi ipamọ data nigbagbogbo jẹ aṣemáṣe lakoko ilana igbero.

Ni gbogbogbo, laibikita ọran lilo, awọn aaye to wọpọ mẹrin wa ninu ilana ikẹkọ awoṣe:

1. Awoṣe Ikẹkọ
2. Ohun elo Inference
3. Data Ibi ipamọ
4. Onikiakia Computing

Nigbati o ba ṣẹda ati imuṣiṣẹ awọn awoṣe, ọpọlọpọ awọn ibeere ṣe pataki ẹri-ti-imọran (POC) tabi awọn agbegbe idanwo lati bẹrẹ ikẹkọ awoṣe, pẹlu awọn aini ipamọ data ko fun ni akiyesi giga.

Bibẹẹkọ, ipenija naa wa ni otitọ pe ikẹkọ tabi imuṣiṣẹ ifilọlẹ le ṣiṣe ni fun awọn oṣu tabi paapaa awọn ọdun. Ọpọlọpọ awọn ile-iṣẹ ni kiakia ṣe iwọn awọn iwọn awoṣe wọn ni akoko yii, ati pe awọn amayederun gbọdọ faagun lati gba awọn awoṣe dagba ati awọn iwe data.

Iwadi lati ọdọ Google lori awọn miliọnu awọn iṣẹ ikẹkọ ML ṣafihan pe aropin 30% ti akoko ikẹkọ ni lilo lori opo gigun ti data igbewọle. Lakoko ti iwadii ti o kọja ti dojukọ lori jipe ​​awọn GPUs lati yara ikẹkọ, ọpọlọpọ awọn italaya ṣi wa ni jijẹ ọpọlọpọ awọn apakan ti opo gigun ti data. Nigbati o ba ni agbara iširo pataki, igo gidi yoo di bii yarayara o le ifunni data sinu awọn iṣiro lati gba awọn abajade.

Ni pataki, awọn italaya ni ibi ipamọ data ati iṣakoso nilo igbero fun idagbasoke data, gbigba ọ laaye lati yọkuro iye data nigbagbogbo bi o ṣe nlọsiwaju, ni pataki nigbati o ba ni ilọsiwaju si awọn ọran lilo ilọsiwaju diẹ sii bii ikẹkọ jinlẹ ati awọn nẹtiwọọki nkankikan, eyiti o gbe awọn ibeere giga si lori ibi ipamọ ni awọn ofin ti agbara, iṣẹ, ati scalability.

Gegebi bi:

Scalability
Ẹkọ ẹrọ nilo mimu data lọpọlọpọ, ati bi iwọn data ṣe n pọ si, deede ti awọn awoṣe tun ni ilọsiwaju. Eyi tumọ si pe awọn iṣowo gbọdọ gba ati tọju data diẹ sii lojoojumọ. Nigbati ibi ipamọ ko ba le ṣe iwọn, awọn ẹru iṣẹ aladanla data ṣẹda awọn igo, diwọn iṣẹ ṣiṣe ati abajade ni akoko aiṣiṣẹ GPU ti o niyelori.

Irọrun
Atilẹyin irọrun fun awọn ilana pupọ (pẹlu NFS, SMB, HTTP, FTP, HDFS, ati S3) jẹ pataki lati pade awọn iwulo ti awọn eto oriṣiriṣi, dipo ki o ni opin si iru agbegbe kan.

Lairi
Lairi I/O ṣe pataki fun kikọ ati lilo awọn awoṣe bi data ṣe n ka ati tun ka ni igba pupọ. Idinku I/O le dinku akoko ikẹkọ ti awọn awoṣe nipasẹ awọn ọjọ tabi awọn oṣu. Idagbasoke awoṣe yiyara taara tumọ si awọn anfani iṣowo nla.

Gbigbe
Ṣiṣejade ti awọn ọna ipamọ jẹ pataki fun ikẹkọ awoṣe daradara. Awọn ilana ikẹkọ pẹlu awọn oye nla ti data, ni igbagbogbo ni terabytes fun wakati kan.

Ni afiwe Wiwọle
Lati ṣaṣeyọri iṣelọpọ giga, awọn awoṣe ikẹkọ pin awọn iṣẹ ṣiṣe si awọn iṣẹ ṣiṣe ti o jọra pupọ. Eyi nigbagbogbo tumọ si pe awọn algorithms ikẹkọ ẹrọ wọle si awọn faili kanna lati awọn ilana pupọ (o ṣee ṣe lori awọn olupin ti ara pupọ) ni nigbakannaa. Eto ipamọ gbọdọ mu awọn ibeere nigbakanna laisi iṣẹ ṣiṣe.

Pẹlu awọn agbara iyalẹnu rẹ ni lairi kekere, iṣelọpọ giga, ati I/O ni afiwe iwọn-nla, Dell PowerScale jẹ ibaramu ibi ipamọ to peye si iširo-iyara GPU. PowerScale ni imunadoko ni idinku akoko ti o nilo fun awọn awoṣe itupalẹ ti o ṣe ikẹkọ ati idanwo awọn datasettes olona-terabyte. Ni PowerScale gbogbo-filaṣi ipamọ, bandiwidi pọ si nipasẹ awọn akoko 18, imukuro awọn igo I / O, ati pe o le ṣe afikun si awọn iṣupọ Isilon ti o wa tẹlẹ lati mu yara ati ṣii iye ti awọn oye nla ti data ti a ko ṣeto.

Pẹlupẹlu, awọn agbara iraye si ilana-ọpọlọpọ ti PowerScale pese irọrun ailopin fun ṣiṣiṣẹ awọn ẹru iṣẹ, gbigba data laaye lati tọju ni lilo ilana kan ati wọle si lilo omiiran. Ni pataki, awọn ẹya ti o lagbara, irọrun, iwọn, ati iṣẹ-ṣiṣe ile-iṣẹ ti Syeed PowerScale ṣe iranlọwọ lati koju awọn italaya wọnyi:

- Imudara ĭdàsĭlẹ nipasẹ to awọn akoko 2.7, idinku ọmọ ikẹkọ awoṣe.

- Imukuro I/O igo ati pese ikẹkọ awoṣe yiyara ati afọwọsi, imudara iwọntunwọnsi awoṣe, imudara iṣẹ ṣiṣe imọ-jinlẹ data, ati ipadabọ ti o pọ si lori awọn idoko-owo iširo nipa gbigbe awọn ẹya ipele ile-iṣẹ ṣiṣẹ, iṣẹ giga, concurrency, ati iwọn. Ṣe ilọsiwaju deede awoṣe pẹlu jinle, awọn ipilẹ data ti o ga-giga nipa gbigbele to 119 PB ti agbara ibi ipamọ to munadoko ninu iṣupọ kan.

- Ṣe aṣeyọri imuṣiṣẹ ni iwọn nipa bibẹrẹ kekere ati iṣiro iwọn ominira ati ibi ipamọ, jiṣẹ aabo data to lagbara ati awọn aṣayan aabo.

- Ṣe ilọsiwaju iṣelọpọ imọ-jinlẹ data pẹlu awọn atupale ibi-aye ati awọn solusan ti a fọwọsi tẹlẹ fun yiyara, awọn imuṣiṣẹ eewu kekere.

- Gbigbe awọn apẹrẹ ti a fihan ti o da lori awọn imọ-ẹrọ ti o dara julọ, pẹlu isare NVIDIA GPU ati awọn ile-itumọ pẹlu awọn eto NVIDIA DGX. Išẹ giga ti PowerScale ati concurrency pade awọn ibeere iṣẹ ibi ipamọ ni gbogbo ipele ti ẹkọ ẹrọ, lati gbigba data ati igbaradi si ikẹkọ awoṣe ati itọkasi. Paapọ pẹlu ẹrọ iṣẹ OneFS, gbogbo awọn apa le ṣiṣẹ lainidi laarin iṣupọ-iwakọ OneFS kanna, pẹlu awọn ẹya ipele ile-iṣẹ bii iṣakoso iṣẹ ṣiṣe, iṣakoso data, aabo, ati aabo data, ṣiṣe ni iyara ipari ikẹkọ awoṣe ati afọwọsi fun awọn iṣowo.


Akoko ifiweranṣẹ: Jul-03-2023