Microsoft, IndexNow e Internet Archive: cosa cambia per la SEO nel 2026

Il 17 aprile 2026 Fabrice Canel di Microsoft Bing ha pubblicato su X che Internet Archive ha adottato IndexNow per rendere più facile il backup di contenuti freschi. La notizia è passata sotto traccia rispetto al resto degli aggiornamenti SEO del mese, ma tocca due dei sistemi di crawling più grandi del web: il motore di ricerca di Microsoft e l'archivio digitale più ampio al mondo, con oltre mille miliardi di pagine conservate.
In questo articolo analizzo cosa è IndexNow, che problema risolve per Internet Archive dopo un 2024-2025 difficilissimo, e cosa cambia in pratica per chi pubblica contenuti sul web oggi. Spoiler: non è una rivoluzione, ma è un segnale utile su dove sta andando la notifica attiva degli URL come alternativa al crawling a pull.
IndexNow in breve: dal crawling a pull alla notifica push
IndexNow è un protocollo aperto lanciato nell'ottobre 2021 da Microsoft Bing e Yandex. L'idea è semplice: invece di aspettare che un motore di ricerca scopra da solo una pagina nuova o modificata attraverso il crawling, il sito invia una notifica POST a un endpoint standard e segnala la URL. Il motore decide se e quando crawlarla, ma ha almeno il dato che esiste.
Il protocollo è supportato oggi da Bing, Yandex, Naver (Corea del Sud), Seznam (Repubblica Ceca) e Yep. Google ha testato IndexNow nel novembre 2021 ma a oggi, aprile 2026, non lo ha ancora adottato e non sembra intenzionato a farlo. Restano le submission via Search Console e il sitemap tradizionale.
I numeri ufficiali più recenti di Microsoft sono del post Bing di dicembre 2024 "Look How Far We've Come". Secondo Microsoft stessa, sono 3,5 miliardi gli URL notificati al giorno via IndexNow e il 18% degli URL cliccati nei risultati Bing arriva da contenuti scoperti tramite questo protocollo. I numeri sono autodichiarati dal vendor, vanno letti con questa cautela. Cloudflare, che ha integrato IndexNow nel novembre 2021 con la funzione Crawler Hints, ha processato oltre 600 miliardi di segnali dal lancio e ha attivato la funzione su circa 60.000 siti.
| Motore | Supporto IndexNow | Data adozione | Note |
|---|---|---|---|
| Bing | Sì (iniziatore) | Ottobre 2021 | Integrazione nativa con Bing Webmaster Tools |
| Yandex | Sì (iniziatore) | Ottobre 2021 | Co-founder del protocollo |
| Naver | Sì | 2022 | Mercato Corea del Sud |
| Seznam | Sì | 2022 | Mercato Repubblica Ceca |
| Yep | Sì | 2023 | Motore privacy-focused |
| No | Mai adottato | Testato brevemente nel 2021, poi abbandonato |
Per il contesto su come funziona il crawling lato Google e perché il problema del crawl budget è diverso da quello di Bing, ho analizzato i limiti tecnici di Googlebot e il Web Rendering Service nella guida su come funziona il crawling di Googlebot.
Internet Archive nel 2026: mille miliardi di pagine e una crisi aperta
Internet Archive è la biblioteca digitale non profit fondata nel 1996 da Brewster Kahle. Il suo servizio più noto è la Wayback Machine, lanciata nel 2001, che archivia versioni storiche delle pagine web. Il 22 ottobre 2025 l'organizzazione ha annunciato il raggiungimento del trilione di pagine web archiviate, un milestone che sul blog ufficiale definisce "civilization-scale".
Sullo sfondo di quel milestone, il biennio 2024-2026 è stato il più critico nella storia dell'ente. Nell'ottobre 2024 un breach ha esposto i dati di 31 milioni di utenti (causa radicale: token GitLab non ruotati per circa due anni), seguito da un attacco DDoS del gruppo BlackMeta e da un secondo incidente su Zendesk. In parallelo, la causa Hachette v. Internet Archive si era chiusa nel marzo 2023 con sentenza sfavorevole al programma Controlled Digital Lending, confermata in appello a settembre 2024.
Il problema che pesa di più sul lavoro di archiviazione, però, è un altro. Secondo un report di Nieman Lab del gennaio 2026, 241 testate giornalistiche in 9 paesi hanno iniziato a bloccare "archive.org_bot" nel proprio robots.txt per timore che i loro contenuti vengano usati come dataset per addestramento di modelli AI. Tra maggio e ottobre 2025 le capture di pagine da siti di news sono crollate dell'87%. Guardian e New York Times sono tra gli editori che hanno chiuso l'accesso.
Cosa risolve IndexNow per la Wayback Machine e perché è rilevante per la SEO
Il flusso di archiviazione di Internet Archive ha sempre funzionato in modalità pull: i crawler dell'organizzazione partono da una lista di siti, scaricano pagine, seguono link, ritornano periodicamente per rilevare modifiche. Questo approccio fatica con contenuti ad alta volatilità, come news, annunci di lavoro, prodotti e-commerce, dove la differenza fra la pubblicazione e la capture può essere di giorni. Sul piano SEO la Wayback Machine conta meno del Bing o del Google di turno, ma conta: i link archive.org compaiono regolarmente nelle SERP di Google quando l'originale restituisce 404, funzionano da memoria del brand e preservano segnali storici per chi fa analisi di backlink.
IndexNow sposta il carico dal crawler al sito. Un publisher che vuole essere archiviato in modo fresco può notificare Internet Archive quando pubblica o aggiorna una URL, esattamente come già fa con Bing. Per il Wayback Machine questo significa tre cose concrete:
- Freschezza degli archivi: le pagine più importanti vengono archiviate entro minuti dalla notifica, non dopo il prossimo ciclo di crawl. Per contenuti con ciclo di vita breve la differenza è sostanziale.
- Meno pressione sui server dei publisher: un crawler pull deve ripassare periodicamente anche su URL che non sono cambiate. Un crawler push viene "chiamato" solo quando c'è qualcosa di nuovo.
- Uso razionale del budget di crawling: Internet Archive ha risorse limitate e non indicizzate quanto Google o Bing. Concentrare il crawling sugli URL notificati migliora la copertura totale a parità di infrastruttura.
Questa non è una relazione nuova in assoluto. Nel post Bing di dicembre 2024, Internet Archive era già citata fra gli adopter di IndexNow insieme a GoDaddy e Condé Nast. Quello che Canel ha reso esplicito ad aprile 2026 è che Microsoft ha assistito Internet Archive nell'adozione del protocollo, non che l'integrazione sia stata costruita oggi da zero.
Cosa cambia per chi pubblica contenuti sul web
Per chi pubblica contenuti online l'impatto di questa adozione si gioca su tre scenari concreti, più uno in cui non cambia niente. Il dato numerico di riferimento resta quello del post Bing di dicembre 2024: 3,5 miliardi di URL notificati al giorno via IndexNow sono il canale più grande di notifica attiva esistente, e Internet Archive ne è parte.
Scenario 1: vuoi essere archiviato meglio
Per siti di news, blog editoriali, e-commerce con catalogo volatile, siti istituzionali o progetti culturali, la Wayback Machine ha un valore duplice. Da una parte è una memoria di backup: se il sito va offline, resta una copia pubblica consultabile. Dall'altra i link archive.org appaiono regolarmente nelle SERP di Google quando l'originale restituisce 404, quindi contribuiscono alla presenza del brand anche dopo la fine di una pagina.
Implementare IndexNow sul sito non aumenta le chance di essere archiviati in sé (Internet Archive non è obbligata a rispettare le notifiche), ma allinea il sito al canale che Microsoft sta promuovendo come standard per la notifica attiva. Il costo è basso: un file di verifica in root e una chiamata HTTP su ogni pubblicazione.
Scenario 2: non vuoi essere archiviato
Se gestisci un sito con contenuti sensibili o semplicemente preferisci non essere archiviato, IndexNow non cambia niente nella sostanza. Una precisazione tecnica serve, però: il protocollo di notifica in sé è agnostico a robots.txt, è Internet Archive che dichiara di rispettarlo nel proprio crawling. Quindi una regola robots.txt ben scritta resta la strada corretta per escludere la Wayback Machine. Le direttive più usate dagli editori nel 2025-2026 includono entrambi gli user-agent storici:
User-agent: ia_archiver
User-agent: archive.org_bot
Disallow: /
Questa è la strada che hanno scelto centinaia di testate giornalistiche tra 2025 e 2026. Nessuna implementazione IndexNow aggira una regola robots.txt lato Internet Archive.
Scenario 3: usi già IndexNow per Bing e basta
Se già notifichi Bing tramite IndexNow, nulla cambia a livello tecnico lato tuo. Il protocollo è un formato standard: il tuo sito manda la stessa POST a un endpoint qualsiasi che aderisca allo standard IndexNow. Il beneficio nuovo è indiretto: le tue pagine potrebbero comparire più rapidamente anche nella Wayback Machine, quindi chi cerca versioni storiche del tuo sito su Google trova snapshot più recenti.
I limiti dell'annuncio e quello che non sappiamo
L'annuncio di Canel è importante come segnale ma lascia aperti diversi punti che vale la pena segnalare, perché chi ha letto solo i titoli rischia di sovrastimare l'impatto.
- Il post originale è stato pubblicato su X, non su un blog ufficiale Microsoft o Internet Archive. Al momento della stesura di questo articolo non risulta un post dedicato sul Bing Webmaster Blog o sul blog di archive.org. La fonte pratica resta la rilettura di Barry Schwartz su Search Engine Roundtable.
- Non è chiaro quando Internet Archive abbia effettivamente iniziato a ricevere notifiche IndexNow. Il post Bing di dicembre 2024 la elencava già fra gli adopter, quindi è possibile che la collaborazione abbia semplicemente trovato una comunicazione pubblica solo adesso.
- IndexNow notifica, non forza. Il protocollo non garantisce l'archiviazione, esattamente come non garantisce l'indicizzazione su Bing. Chi lo implementa aspettandosi una capture istantanea per ogni pagina troverà risultati diversi dalle promesse che circolano sui blog di marketing.
- Google resta fuori. Il 90% del mercato search in Italia passa da Google, che continua a non supportare il protocollo. IndexNow, a oggi, è uno strumento Bing-centrico con benefici collaterali su Yandex, Naver e ora Internet Archive. Non è un sostituto della sitemap.
- L'annuncio non risolve i problemi strutturali di Internet Archive. I blocchi robots.txt dei grandi editori, le conseguenze della sentenza Hachette e il ripristino di fiducia dopo il breach del 2024 sono questioni che un protocollo di notifica URL non può affrontare.
Come implementare IndexNow sul tuo sito in tre passaggi
L'implementazione di IndexNow richiede tre passaggi tecnici e, nella maggior parte dei CMS, meno di un'ora di lavoro. La procedura è documentata sul sito indexnow.org, ma i dettagli che contano per chi la integra in produzione sono questi.
- Genera una chiave e pubblicala. La chiave è una stringa da 8 a 128 caratteri esadecimali. Puoi generarla con un tool su indexnow.org oppure usare un hash casuale. Poi crei un file di testo con la chiave come nome (ad esempio a1b2c3d4e5f6.txt) e come contenuto la chiave stessa, accessibile via HTTPS nella root del dominio. Se la root non è nella tua disponibilità (hosting condiviso, path vincolati, CDN), puoi indicare un percorso alternativo nel campo keyLocation del payload e servire il file da lì.
- Invia la notifica via HTTP POST all'endpoint api.indexnow.org/indexnow. Il payload è un JSON con i campi host, key e una lista di URL. Il limite per singola richiesta è 10.000 URL e tutti gli URL devono appartenere all'host dichiarato. Le risposte rilevanti: 200 per successo, 202 per pending, 400 per payload malformato, 403 per chiave non valida, 429 per rate limit superato. Un payload minimo: { "host": "tuosito.it", "key": "a1b2c3d4e5f6", "urlList": [ "https://tuosito.it/pagina-nuova" ] }.
- Integra la chiamata nel flusso di pubblicazione. Su WordPress esiste il plugin ufficiale IndexNow. Su Wix l'integrazione è nativa, non richiede configurazione. Su siti custom basta un hook sul save del CMS oppure un cron che legge la sitemap e notifica le URL con lastmod recente.
Un dettaglio operativo: se pubblichi tanto contenuto in batch, conviene accorpare le URL in singole POST e rispettare un limite prudenziale di qualche decina di richieste al minuto, anche se Microsoft non pubblica un rate limit ufficiale. Le risposte 429 sono l'unica indicazione pratica di quando stai andando troppo veloce.
Una volta attivo il flusso, verifica che abbia davvero effetto. Su Bing controlli il report URL Submission in Bing Webmaster Tools, che elenca le notifiche ricevute e il loro stato. Sui log di accesso del server, filtra per Bingbot subito dopo ogni notifica: se il tempo fra POST e passaggio del crawler si accorcia rispetto al passato, IndexNow sta funzionando. Un ultimo punto che conviene ricordare: IndexNow accelera la scoperta, non migliora la qualità del contenuto. Una pagina debole notificata resta una pagina debole, solo crawlata prima.
Se gestisci più siti o vuoi inserire IndexNow in una pipeline automatica di pubblicazione, il MCP server di Google Search Console può aiutarti a monitorare l'effetto sull'indicizzazione. Ne ho parlato nella guida su Google Search Console MCP per Claude Code.
L'adozione di IndexNow da parte di Internet Archive non è una rivoluzione. È un tassello che conferma una direzione: le infrastrutture di scoperta del web si stanno spostando verso un modello ibrido dove la notifica attiva affianca il crawling tradizionale. Per chi fa SEO tecnica è utile sapere che lo standard esiste, che Google resta fuori, e che la presenza nella Wayback Machine ha valore anche oltre Bing.
Per capire meglio come Bing e i motori non-Google stanno diventando più rilevanti grazie alla spinta di ChatGPT Search e degli AI answer engine, leggi l'analisi su ChatGPT Search, Bing e la visibilità del brand nell'AI search.
Se vuoi valutare insieme se IndexNow ha senso per il tuo sito o se stai facendo scelte di crawling e indicizzazione che meritano una revisione, scrivimi dalla pagina contatti.
Domande Frequenti
IndexNow è un protocollo aperto lanciato nel 2021 da Microsoft Bing e Yandex. Permette a un sito di notificare ai motori di ricerca una URL nuova o modificata tramite una semplice POST HTTP. Il motore decide se e quando crawlarla, ma riceve il segnale in tempo reale invece di scoprirla da solo.
No. Google ha testato IndexNow nel 2021 ma non lo ha mai adottato. Per Google Search restano i canali tradizionali: sitemap XML e submission via Search Console. IndexNow è oggi supportato da Bing, Yandex, Naver, Seznam, Yep e, dall'aprile 2026, in modo esplicito da Internet Archive.
Su WordPress esiste un plugin ufficiale IndexNow gestito dal team Bing. Lo installi, genera una chiave, la pubblica come file di verifica in root e notifica automaticamente le URL a ogni pubblicazione o aggiornamento. Su Wix la funzione è già attiva senza configurazione.
Le due cose non si escludono, sono complementari. La sitemap è un inventario consultato periodicamente, IndexNow è una notifica attiva che arriva al motore in tempo reale. Per siti con contenuti volatili (news, e-commerce, annunci) IndexNow riduce la latenza fra pubblicazione e scoperta. Per siti statici il beneficio è marginale.
Sì. Nel file robots.txt aggiungi regole di Disallow sugli user-agent storici di Internet Archive: ia_archiver e archive.org_bot. Il protocollo IndexNow in sé è agnostico a robots.txt; è Internet Archive che dichiara di rispettare robots.txt nel proprio crawling. Centinaia di testate giornalistiche hanno scelto questa strada nel 2025-2026 per timore dello scraping AI.
Il limite dichiarato nella documentazione è 10.000 URL per singola POST bulk. Microsoft non pubblica un rate limit globale ufficiale, ma risposte HTTP 429 indicano throttling. In pratica è prudente accorpare e distribuire le richieste nel tempo, non bombardare l'endpoint.
Sull'autore
Claudio Novaglio
SEO Specialist, AI Specialist e Data Analyst con oltre 10 anni di esperienza nel digital marketing. Lavoro con aziende e professionisti a Brescia e in tutta Italia per aumentare la visibilità organica, ottimizzare le campagne pubblicitarie e costruire sistemi di misurazione data-driven. Specializzato in SEO tecnico, local SEO, Google Analytics 4 e integrazione dell'intelligenza artificiale nei processi di marketing.
Vuoi migliorare i tuoi risultati online?
Parliamo del tuo progetto. La prima consulenza è gratuita, senza impegno.