Incontra l'uomo che fa pensare le macchine di Facebook

Quasi 3.000 a miglia di distanza dalla sede di Menlo Park di Facebook, in un vecchio edificio per uffici beige nel centro di Manhattan, un gruppo di dipendenti dell'azienda sta lavorando a progetti che sembrano più adatti alla fantascienza che ai social network. Il team, Facebook Artificial Intelligence Research, noto internamente come FAIR, è concentrato su un unico obiettivo: creare computer con un'intelligenza pari a quella degli umani. Anche se ancora lontano dal traguardo, il gruppo sta compiendo il tipo di progressi che pochi credevano possibili all'inizio del decennio. I suoi programmi di intelligenza artificiale disegnano immagini quasi indistinguibili da quelle di artisti umani e fanno quiz su argomenti selezionati da Wikipedia. Stanno giocando a videogiochi avanzati come Astronave . Lentamente, stanno diventando più intelligenti. E un giorno, potrebbero cambiare Facebook da qualcosa che facilita l'interazione tra amici in qualcosa che potrebbe essere tuo amico.



Per questi e altri motivi, FAIR non è il tipico team di Facebook. I suoi membri non lavorano direttamente sulla collezione di prodotti mega popolari dell'azienda da 410 miliardi di dollari: Instagram, WhatsApp, Messenger e Facebook propriamente detto. Il suo obiettivo finale è probabilmente tra decenni e potrebbe non essere mai raggiunto. Ed è guidato non dal tipico brillante supereroe della Silicon Valley, ma da Yann LeCun, un accademico di 56 anni che ha sperimentato un vero fallimento nella sua vita ed è riuscito a tornare. Le sue teorie un tempo respinte sull'intelligenza artificiale sono oggi considerate di livello mondiale e la sua rivendicazione è la taglia di Facebook.

La tua interazione con il mondo digitale, il tuo telefono, il tuo computer, sarà trasformata, ha detto LeCun a BuzzFeed News di ciò che potrebbe essere.



FAIR sta migliorando la capacità dei computer di vedere, ascoltare e comunicare da soli e le sue scoperte ora permeano i prodotti di Facebook, toccando tutto, dalla classifica del feed di notizie alle fotocamere e ai filtri fotografici. E Facebook sta investendo alla grande, non solo perché l'intelligenza artificiale è interessante, ma perché è necessaria. In tutti gli angoli della tecnologia oggi, le aziende competono sulla base della loro intelligenza artificiale. Le auto autonome alimentate dall'intelligenza artificiale di Uber sono nucleo alla sua strategia di ride-hailing. L'altoparlante intelligente Google Home di Google basato sull'intelligenza artificiale sta rispondendo alle domande gli utenti una volta digitavano nella barra di ricerca (e, molto prima, cercavano nell'enciclopedia). Amazon è costruire minimarket con cassieri artificialmente intelligenti nel tentativo di decifrare il mercato alimentare da 674 miliardi di dollari.

E su Facebook, l'intelligenza artificiale è ovunque. I suoi filtri fotografici basati sull'intelligenza artificiale, ad esempio, lo stanno aiutando a respingere una sfida da Snapchat. La capacità della sua intelligenza artificiale di guardare le immagini, vedere cosa c'è dentro e decidere cosa mostrarti nei suoi feed sta aiutando l'azienda a fornire un'esperienza avvincente che ti fa tornare. E una tecnologia simile monitora i contenuti molesti, terroristici e pornografici e li segnala per la rimozione.

Le esperienze che le persone hanno sull'intera famiglia di prodotti Facebook dipendono in modo critico dall'intelligenza artificiale, ha affermato Joaquin Candela, capo del gruppo Applied Machine Learning di Facebook, o AML, che mette in atto la ricerca sulla piattaforma stessa. Oggi, Facebook non potrebbe esistere senza AI. Periodo.

Man mano che il campo diventa più avanzato, Facebook si affiderà a LeCun e al suo team per aiutarlo a stare al passo con i concorrenti, nuovi o attuali, che probabilmente abbracceranno la scienza.

Dopo anni di critiche ed emarginazione, LeCun ha finalmente tutto: 80 ricercatori, il sostegno delle vaste risorse finanziarie di Facebook e la fiducia nel suo lavoro. Tutto quello che deve fare ora è consegnare.

Per gentile concessione di Facebook

LeCun a Manhattan.

Vista

Fin dalla tenera età , LeCun credeva di poter far vedere ai computer. Il riconoscimento facciale e il rilevamento delle immagini possono essere standard oggi, ma quando LeCun era uno studente universitario a Parigi nei primi anni '80, i computer erano effettivamente ciechi, incapaci di dare un senso a qualsiasi cosa all'interno delle immagini o di capire cosa stesse apparendo all'interno degli obiettivi delle loro fotocamere. Fu al college che LeCun si imbatté in un approccio al campo che era rimasto in gran parte inesplorato dagli anni '60, ma che pensava potesse potenzialmente consentire alle macchine di apprendere molti compiti, inclusa la percezione.

L'approccio, chiamato rete neurale artificiale, prende sistemi di piccoli sensori interconnessi e li fa scomporre contenuti come immagini in parti minuscole, quindi identifica modelli e decidono cosa stanno vedendo in base ai loro input collettivi. Dopo aver letto le argomentazioni contro le reti neurali, vale a dire che erano difficili da addestrare e non particolarmente potenti, LeCun ha deciso di andare avanti comunque, perseguendo un dottorato di ricerca in cui si sarebbe concentrato su di esse nonostante i dubbi. Semplicemente non ci credevo, ha detto delle critiche.

Tempi duri nel campo dell'intelligenza artificiale si verificano con tale frequenza e intensità da avere un nome speciale: AI Winter. Questi periodi si verificano in gran parte quando i risultati dei ricercatori non sono all'altezza delle loro vanterie, facendo sembrare che la scienza non funzioni, causando l'esaurimento di finanziamenti e interessi, e il progresso tecnologico con esso.

LeCun ha visto la sua giusta dose di AI Winter. Dopo essersi stabilito in un lavoro di ricerca sull'intelligenza artificiale presso i Bell Labs a metà degli anni '90, i conflitti interni all'AT&T hanno causato la rottura del suo team proprio mentre stava lanciando gli sportelli automatici per la lettura degli assegni - tecnologia alimentata da reti neurali che è ancora in uso oggi - proprio come LeCun credeva di fare progressi evidenti. L'intero progetto è stato sciolto essenzialmente il giorno in cui stava diventando un vero successo, ha detto LeCun. Questo era davvero deprimente.

Allo stesso tempo, altri metodi stavano guadagnando il favore dei ricercatori tradizionali. Questi metodi sarebbero poi caduti in disgrazia, ma la loro ascesa è stata sufficiente a spingere le reti neurali - e LeCun, il loro campione di lunga data - ai margini del campo. All'inizio degli anni 2000, altri accademici non gli permettevano nemmeno di presentare i suoi documenti alle loro conferenze. La comunità della visione artificiale lo ha sostanzialmente respinto, ha detto a BuzzFeed News Geoff Hinton, un pioniere delle reti neurali che attualmente è un ricercatore di ingegneria presso Google e professore all'Università di Toronto. L'opinione era che stesse continuando a fare cose che erano state promettenti negli anni '80, ma ormai avrebbe dovuto superarlo, ha spiegato Hinton.

Questa non è più la vista, ha aggiunto.

Visualizza questo post su Facebook

facebook.com

Altri ricercatori di reti neurali hanno riscontrato problemi simili all'epoca. Yoshua Bengio, professore all'Università di Montreal e capo del Montreal Institute for Learning Algorithms, ha avuto difficoltà a trovare studenti laureati disposti a lavorare con lui. Ho dovuto torcere le braccia dei miei studenti per lavorare in quest'area perché avevano paura di non avere un lavoro quando avrebbero finito il dottorato, ha detto a BuzzFeed News.

Nel 2003, LeCun ha posto le basi per la sua redenzione. Quell'anno, si unì alla facoltà della New York University e si unì anche a Hinton e Bengio in una coalizione in gran parte informale per far rivivere le reti neurali. Abbiamo iniziato quella che ho chiamato la Deep Learning Conspiracy, ha detto LeCun con un sorriso.

La comunità della visione artificiale lo ha praticamente rifiutato.

La Deep Learning Conspiracy ha svolto un ruolo fondamentale nel campo, soprattutto in virtù della convinzione che invece di costruire reti neurali individuali e specializzate per ogni tipo di oggetto che si desidera rilevare, è possibile utilizzare lo stesso modello per costruire un neurale che potrebbe rilevare immagini, video e voce. Quindi, invece di costruire una rete neurale per rilevare i pinguini e un'altra per i gatti, potresti costruire un'unica rete neurale in grado di rilevare entrambi e distinguere. Queste nuove reti neurali potrebbero anche essere modificate per altri compiti, come osservare le onde audio per rilevare i modelli del parlato.

La ricerca di The Conspiracy è stata sostenuta da due importanti fattori esterni: l'aumento della potenza di calcolo, che ha aiutato le sue reti neurali a funzionare abbastanza velocemente da essere pratico, e un aumento esponenziale dei dati disponibili (immagini, testo, ecc.) creato grazie all'adozione diffusa di Internet, che potrebbe essere agitato attraverso le reti per renderle più intelligenti. Il risultato alla fine è diventato un approccio agile, veloce e accurato che ha aperto nuove possibilità per il campo.

Con le basi stabilite da LeCun e dai suoi compatrioti, la visione artificiale è esplosa nei primi anni 2010. I computer hanno iniziato a riconoscere gli oggetti nelle immagini, poi nei video e poi vivono nella fotocamera. Ora puoi puntare una fotocamera su un pallone da basket e l'intelligenza artificiale può capire cosa sta guardando. LeCun è passato rapidamente da ragazzo in disparte a leader nel campo. È passato da nessuno che ci lavorava a tutti che ci lavoravano entro un anno, ha detto LeCun. È semplicemente folle - è completamente folle.

Nel dicembre 2013, LeCun si è unito a Facebook, un ambiente ideale per chi è interessato ad applicare la ricerca AI alle foto. La piattaforma di Facebook è piena di miliardi di immagini, offrendo a LeCun e ai suoi ricercatori una vasta tela per implementare nuove idee. FAIR collabora regolarmente con AML, per mettere in atto le sue ricerche su Facebook vero e proprio. I due gruppi creano nuovi sistemi che rendono disponibili i progressi in tutta l'azienda. AML sta utilizzando la ricerca di FAIR per aiutare a determinare quali contenuti ti vengono mostrati nel feed delle notizie, per tradurre i contenuti all'interno di Facebook; lo sta anche distribuendo all'interno della fotocamera di Facebook per creare effetti speciali che reagiscono al tuo movimento.



Per gentile concessione di Facebook

Un esempio di SharpMark, uno degli strumenti di visione artificiale di FAIR.

Pensato

Insegnare ai computer a vedere è un passo fondamentale per insegnare loro come funziona il mondo. Gli umani capiscono come funziona il mondo perché osserviamo scenari ripetuti più e più volte e sviluppiamo una comprensione di come si svolgeranno. Quando un'auto arriva a tutta velocità lungo una strada in cui ci troviamo, ad esempio, prevediamo che potrebbe colpirci, quindi ci togliamo di mezzo. Quando fa buio, prevediamo che l'attivazione di un interruttore della luce lo farà riaccendere, quindi lo giriamo.

FAIR sta cercando di insegnare ai computer a prevedere i risultati, proprio come fanno gli esseri umani, utilizzando un metodo simile. Il team, ha spiegato LeCun, sta mostrando alla sua intelligenza artificiale molti video correlati, quindi li mette in pausa a un certo punto e chiede alla macchina di prevedere cosa succederà dopo. Se mostri ripetutamente a un sistema di intelligenza artificiale video di bottiglie d'acqua che vengono capovolte sulla testa delle persone, ad esempio, potresti potenzialmente prevedere che l'azione farà bagnare qualcuno.

L'essenza dell'intelligenza, in una certa misura, è la capacità di prevedere, ha spiegato LeCun. Se puoi prevedere cosa accadrà come conseguenza delle tue azioni, allora puoi pianificare. Puoi pianificare una sequenza di azioni che raggiungeranno un determinato obiettivo.

Insegnare all'intelligenza artificiale a prevedere è una delle sfide più fastidiose nel campo oggi, soprattutto perché ci sono molte situazioni in cui più risultati possibili sono teoricamente corretti.

L'essenza dell'intelligenza, in una certa misura, è la capacità di prevedere.

Immagina, disse LeCun, tenendo una penna verticalmente sopra un tavolo e lasciandola andare. Se chiedi a un computer dove sarà la penna in un secondo, non c'è una risposta corretta: la macchina sa che la penna cadrà, ma non può sapere esattamente dove atterrerà. Quindi devi dire al sistema che ci sono più risposte corrette e che ciò che accade effettivamente è solo un rappresentante di un intero insieme di alternative. Questo è il problema di imparare a prevedere in condizioni di incertezza.

Aiutare l'intelligenza artificiale a comprendere e abbracciare l'incertezza fa parte di una disciplina dell'intelligenza artificiale chiamata apprendimento non supervisionato, attualmente all'avanguardia nel settore. Quando l'intelligenza artificiale ha osservato abbastanza per sapere come funziona il mondo e prevedere cosa accadrà dopo, può iniziare a pensare un po' più come gli umani, guadagnando una sorta di buon senso, che, secondo LeCun, è la chiave per rendere le macchine più intelligenti.

LeCun e i suoi ricercatori ammettono che molto probabilmente ci vorranno anni prima che l'IA apprezzi appieno le aree grigie, ma sono fiduciosi che ci riusciranno. Succederà, ha detto Larry Zitnick, un manager di ricerca che lavora sotto LeCun. Ma direi che è più un orizzonte di 10 anni.




Facebook: idiota

Un fermo immagine dal video di 'Jarvis' di Zuckerberg.

Discorso

Torna a dicembre , Mark Zuckerberg ha pubblicato un video appariscente che mostrava il suo maggiordomo AI, Jarvis. Codificato dallo stesso fondatore di Facebook, Jarvis ha fatto un brindisi a Zuckerberg, ha permesso ai suoi genitori di entrare in casa sua dopo aver riconosciuto i loro volti e ha persino insegnato alla sua bambina, Max, una lezione di mandarino.

Jarvis era fantastico. Ma per LeCun, non era niente di speciale. È per lo più sceneggiato, ed è relativamente semplice, e l'intelligenza è un po' superficiale, in un certo senso, ha detto LeCun. Le sue mire sono più alte.

Jarvis era fantastico. Ma per LeCun, non era niente di speciale.

LeCun vuole costruire assistenti, ma quelli che veramente capire cosa gli dici. «Macchine in grado di sostenere una conversazione, ha detto. Macchine che possono pianificare in anticipo. Macchine di cui non ti infastidisci perché sono stupide.

Non esiste un progetto per questo, ma FAIR sta lavorando su quelli che potrebbero essere gli elementi costitutivi. Dare all'IA una comprensione rudimentale del mondo e addestrarla a prevedere cosa potrebbe accadere al suo interno è una componente. Così sta insegnandogli a leggere e scrivere, cosa per cui FAIR sta usando anche le reti neurali. Per un computer, un'immagine è una matrice di numeri, ma una frase pronunciata può anche essere rappresentata come una matrice di numeri, così come il testo. Pertanto, persone come LeCun possono utilizzare architetture di reti neurali per identificare l'oggetto nelle immagini, le parole nelle frasi pronunciate o gli argomenti nel testo.

L'intelligenza artificiale non è ancora in grado di comprendere le parole nel modo in cui comprende le immagini, ma LeCun ha già una visione di come potrebbe essere il Jarvis definitivo. Il suo assistente ideale possiederà buon senso e capacità di comunicare con altri assistenti. Se vuoi andare a un concerto con un amico, ad esempio, diresti ai tuoi assistenti di coordinarsi e loro confronterebbero i tuoi gusti musicali, i calendari e gli atti disponibili per suggerire qualcosa che funzioni.

La macchina deve fornire una sorta di rappresentazione dello stato del mondo, ha detto LeCun, descrivendo la sfida. Le persone non possono essere in due posti contemporaneamente, le persone non possono andare da New York a San Francisco in un certo numero di ore, fattore del costo del viaggio: ci sono molte cose che devi sapere per organizzare il viaggio di qualcuno vita.

Facebook sta attualmente sperimentando una versione semplice di questi assistenti digitali chiamata M, gestita dal suo team Messenger e basandosi su alcune ricerche FAIR. Facebook Messenger ha recentemente rilasciato suggerimenti M, in cui M si inserisce nelle conversazioni nei momenti in cui pensa di poter essere d'aiuto. Quando qualcuno chiede dove sei? ad esempio, M può entrare nella conversazione e darti la possibilità di condividere la tua posizione con un tocco. È probabile che l'azienda amplierà questa funzionalità in usi più avanzati.

M è un'applicazione degli sforzi di Facebook che utilizza l'intelligenza artificiale per comprendere il significato, ma l'azienda sta valutando altri usi per la tecnologia. Potrebbe persino metterlo al lavoro nel tentativo di abbattere le barriere che è stato recentemente accusato di aver contribuito a creare.

Anche prima che le elezioni del 2016 attirassero l'attenzione sulla polarizzazione e sulle notizie false su Facebook, Y-Lan Boureau, un membro del team di LeCun, stava lavorando per utilizzare l'intelligenza artificiale per creare conversazioni più costruttive su Facebook. Boureau, che ha studiato neurologia e intelligenza artificiale, ha deciso di perseguire questo progetto dopo aver trascorso un'estate a guardare i suoi amici litigare su Facebook con scarso interesse a sentire opinioni opposte. Se potessimo capire meglio cosa spinge le persone in termini di stato d'animo, ha spiegato Boureau, e come si formano le opinioni e come si ossificano e si cristallizzano, e come si può finire con due persone che non sono in grado di parlarsi, questo sarebbe una cosa molto buona.

Boureau vuole creare un mondo in cui vediamo quante più opinioni possiamo gestire, fino al punto in cui iniziamo a ignorarle. L'intelligenza artificiale può aiutare in questo mappando schemi nel testo, comprendendo dove qualcosa va fuori dai binari e potenzialmente trovare un modo per alterare il flusso della conversazione per arginare la brutta svolta. Se sapessimo di più su quel processo di apprendimento e su come queste convinzioni entrano nella testa delle persone dai dati, allora potrebbe essere più facile capire come ottenere conversazioni più costruttive in generale, ha detto Boureau.

All'indomani delle elezioni del 2016, LeCun suggerito pubblicamente Facebook aveva le capacità tecniche per utilizzare l'intelligenza artificiale per filtrare le notizie false. Alcuni hanno visto la sua dichiarazione come una soluzione a un problema che molti hanno accusato della diffusa polarizzazione negli Stati Uniti, ma LeCun ha affermato che il compito era meglio lasciare a terzi, invece che a macchine in grado di introdurre pregiudizi. C'è un ruolo che l'intelligenza artificiale può svolgere lì, ma è un problema di progettazione del prodotto molto difficile piuttosto che un problema tecnologico, ha affermato. Non vuoi portare le persone a opinioni particolari. Vuoi essere neutrale in questo senso.



Per gentile concessione di Facebook

Esempi di SharpMark di FAIR.

Realtà

Cicli di hype può essere pericoloso per il campo dell'IA, come ben sa LeCun. E oggi, sembra certamente che siamo in uno. Nel primo trimestre del 2013, sei società hanno menzionato l'intelligenza artificiale nelle chiamate agli utili. Nel primo trimestre del 2017, 244 ha fatto , secondo Bloomberg.

LeCun è attento a esprimere le sue dichiarazioni quando si discute del futuro. Questo è ancora molto lontano da dove vogliamo che sia, dirà. Le cose non funzionano così bene come vorremmo, avvertirà. In effetti, come avverte LeCun, l'intelligenza artificiale è ancora lontana dal raggiungere l'intelligenza a livello umano, o l'intelligenza artificiale generale come è nota.

I cicli di hype possono essere pericolosi per il campo dell'IA, come ben sa LeCun.

Tuttavia, a volte LeCun non riesce a trattenere il suo entusiasmo. È particolarmente entusiasta della formazione in contraddittorio, una forma relativamente nuova di ricerca sull'intelligenza artificiale che potrebbe aiutare a risolvere le sfide di previsione e incertezza che il campo deve affrontare oggi. L'addestramento al contraddittorio mette due sistemi di intelligenza artificiale l'uno contro l'altro nel tentativo di convincerli a imparare da soli il mondo reale. In un esperimento FAIR, ad esempio, un ricercatore ha un sistema di intelligenza artificiale che disegna immagini nel tentativo di indurre un altro a indovinare che sono state disegnate da esseri umani. Il primo utilizza il feedback del secondo per imparare a disegnare meglio.

a un conferenza all'inizio di quest'anno, LeCun ha mostrato qualcosa di ancora più avanzato: il tentativo di una IA di convincere una seconda IA ​​che alcuni fotogrammi di un video creavano parte di un video che la seconda IA ​​aveva già visto. La formazione in contraddittorio, ha affermato LeCun, è l'idea migliore e più interessante nel campo dell'apprendimento automatico negli ultimi 10 o 20 anni.

E così LeCun continuerà a giocare con la formazione del contraddittorio, spingendo ancora una volta il campo ai suoi confini. Ha fatto molta strada dall'uomo che 20 anni fa non riusciva nemmeno a far sentire le sue idee. Anche se LeCun sarà il primo a dirti che il lavoro è tutt'altro che finito e che il successo è tutt'altro che suo, non è uno che lascia passare il momento senza un po' di apprezzamento. Non posso dire che si senta male, disse. È fantastico.●