Er munur á milli sjálfvirkra kóðara og umbreytingakóða í djúpt nám?


svara 1:

Svona myndi ég sjá þessi tvö hugtök (óformleg). Hugsaðu um umbreytingakóðann sem mjög almenna ramma / arkitektúrhönnun. Í þessari hönnun ertu með aðgerð sem kortleggur inntaksrými, hvernig sem það kann að vera, í annað / dulda rýmið („umritunarvísinn“). Afkóðari er einfaldlega viðbótaraðgerðin sem býr til kort frá dulda rými (umrita) í annað markrými (það sem við viljum afkóða úr dulda rýminu). Athugaðu að með því einfaldlega að kortleggja rými og tengjast í sameiginlegu dulda rými geturðu kortlagt röð tákn á ensku (þ.e. ensk setning) við röð tákna á frönsku (þ.e. þýðing þessarar ensku setningu) á frönsku. Í sumum taugaþýðingarlíkönum kortleggir þú enska röð á fastan vektor (til dæmis síðasta ástandið sem fannst þegar greinarmerki endurtekinna neta er náð, sem þú vinnur setninguna með í endurtekningu), sem þú afkennir franska röð.

Sjálfvirkur kóðari (eða sjálfvirkur tengibúnaður, eins og það var kallað sígilt) er sérstakt tilfelli af umritunarforriti um umskráningu og umbreytingu - í fyrsta lagi, markrýmið er það sama og inntaksrýmið (þ.e.a.s. enskt inntak í ensk markmið) og í öðru lagi ætti markmiðið að vera það sama og inntakið. Svo við myndum kortleggja eitthvað eins og vigra á vigra (athugaðu að þetta gæti samt verið röð þar sem það er endurtekinn sjálfvirkur kóðari, en í þessu tilfelli ertu ekki að spá fyrir um framtíðina heldur einfaldlega endurgera nútímann með hliðsjón af ríki / minni og gjöfin). Jæja, sjálfvirkt kóðara er raunverulega ætlað að gera sjálfvirka kortlagningu. Svo í raun erum við að reyna að byggja upp líkan til að fá inntakið. Þetta gerir sjálfvirka kóðuninni kleift að ljúka sýninu, til dæmis ef við gefum sjálfvirka kóðuninni okkar hluta skemmda inntak. það væri hægt að ná réttu mynstri úr minni.

Við smíðum einnig venjulega sjálfkóðara vegna þess að við höfum meiri áhuga á að fá framsetning en að læra spá fyrirmynd (þó að maður gæti haldið því fram að við fáum líka nokkuð gagnlegar framsetningar á spá líkön…).

En smásagan er einföld: sjálfvirkt umrita í dulmál er í raun sérstakt dæmi um umbreytingu um umbreytingakóða. Þetta er sérstaklega gagnlegt þegar við viljum afkóða kóðann og umlykilinn til að búa til eitthvað eins og tilbrigði sjálfvirkt kóðara, sem einnig losar okkur frá því að þurfa að smíða afkóðara samhverft með kóðanum (þ.e. kóðinn gæti verið 2 lag Convolution netið á meðan myndlykillinn gæti verið þriggja laga aflausnarkerfi). Í sjálfvirkum umritunarritara tilbrigða verður hugmyndin um dulda rými skýrari vegna þess að við erum nú í raun að kortleggja inntakið (t.d. mynd eða skjalaferð) við dulda breytu sem við fáum upprunalegu / sömu inntakið (t.d. myndina ) endurgera eða skjalaferða).

Ég held líka að það að misnota hugtökin skapi mikið rugl. Nú á dögum hafa ML-menn sérstaklega tilhneigingu til að blanda saman og passa orð (sumir gera þetta til að láta hlutina hljóma flottari eða finna leitarorð sem laða að lesendur / styrktaraðila / frægð / frægð / osfrv.), En það gæti að hluta til verið vegna að endurnefna gervin taugakerfi þess sem „djúpt nám“ ;-) [þar sem allir vilja að lokum að peningar haldi áfram að vinna]


svara 2:

Reyndar.

Arkitektur fyrir umbreytingarlykóða hefur kóðarahluta sem fær inntak og úthlutar því í dulda rými. Afkóðarihlutinn tekur þetta dulda rými og tengir það úttak. Venjulega leiðir þetta til betri árangurs. Sjálfvirkur kóðari tekur einfaldlega x sem inntak og reynir að endurgera x (nú x_hat) sem framleiðsla.

Notkunartilfellin eru venjulega mismunandi. Sjálfkóðarar eru almennt notaðir við óskoðaða námsaðstæður því eins og við sjáum er engin merking krafist, aðeins gögn. Arkitektúr fyrir umbreytingarlykóða er oft notað almennt, eins og þú lýstir í SegNet pappírnum og oftar á NMT.