¿Puede tu proveedor de nube entrenar IA con tus archivos?

Si alguna vez te ha preocupado que los archivos que subes a un servicio en la nube acaben entrenando la IA de alguien, la respuesta honesta es más inquietante que un simple sí o no.

La mayoría de los grandes proveedores te dirán, con verdad, que no entrenan modelos de IA con los archivos que almacenas. Pero casi todos pueden hacerlo. Tienen las claves de tus datos, pueden leerlos, y "no lo hacemos" es una política que ellos escribieron y pueden reescribir. Lo único que se interpone entre tus archivos y un modelo de IA es una promesa. Y como han demostrado los últimos dos años, esas promesas cambian, en silencio, y a menudo justo después del lanzamiento de un producto o de una adquisición.

Esta página trata de esa brecha: entre lo que un proveedor dice que hace hoy y lo que su arquitectura le permite hacer mañana. Cada afirmación de abajo está fechada y enlazada a los propios términos actuales del proveedor, porque el sentido mismo de la página es que esos términos no dejan de moverse.

La versión corta

El almacenamiento en la nube se divide en tres niveles. Solo el tercero elimina la capacidad de la empresa para leer tus archivos.

Proveedor	¿Pueden leer tus archivos?	Su postura sobre la IA y tu contenido	La protección es
Google Drive	Sí. Google tiene las claves.	Dice que el contenido de Workspace no se usa para entrenar sus modelos sin permiso. La actividad de Gemini de consumo sí puede usarse para entrenar sus modelos cuando el ajuste Keep Activity está activado.	Una promesa de política
Microsoft OneDrive	Sí. Microsoft tiene las claves.	Dice que el contenido de tenant de Microsoft 365 no se usa para entrenar sus modelos base. Algunos datos de Copilot de consumo, Bing y MSN sí se usan para entrenar IA salvo que te excluyas.	Una promesa de política
Dropbox	Sí. Dropbox tiene las claves.	Se compromete a no construir IA generativa con tu contenido sin consentimiento, pero sí entrena sus propios modelos no generativos con tus documentos y metadatos para potenciar funciones.	Una promesa de política
pCloud	Sí, por defecto.	El cifrado del lado del cliente es un complemento de pago limitado a una carpeta Crypto. Todo lo de fuera, pCloud puede leerlo. El software es de código cerrado.	Una promesa. Arquitectura solo dentro de la carpeta de pago.
Apple iCloud	Solo si no activas la Protección de Datos Avanzada, que está desactivada por defecto.	Procesa en el dispositivo y vía Private Cloud Compute. Dice que no usa tus datos personales para entrenar sus modelos base.	Arquitectura si activas la ADP. Si no, una promesa.
MEGA	Por diseño, no. Ver la advertencia de 2022 más abajo.	De conocimiento cero por defecto, así que dice que no puede escanear ni entrenar con tus archivos.	Arquitectura, con una advertencia documentada y ya parcheada.
Proton Drive	No.	De conocimiento cero por defecto. Declara que no puede escanear archivos para anuncios ni para entrenar IA.	Arquitectura, por defecto.
ShieldFive	No. De conocimiento cero por diseño.	No puede entrenar IA con tus archivos, porque no puede leerlos. No por política, por matemáticas.	Arquitectura, por defecto.

La pregunta de verdad

El debate suele plantearse como "¿esta empresa entrena IA con mis archivos?" Esa es la pregunta equivocada, porque la respuesta casi siempre es "no como temes, no ahora mismo", y "no ahora mismo" no vale nada si la empresa puede cambiar de opinión.

La pregunta que de verdad te protege es: ¿podrían, si lo decidieran?

Si un proveedor tiene tus claves de cifrado, puede leer tus archivos. Si puede leerlos, puede entregárselos a un modelo, a pesar de la política de hoy.
Un nuevo producto, una adquisición o una actualización silenciosa de los términos pueden convertir "no lo hacemos" en "lo hacemos", a menudo con nada más que un correo que ojearás y aceptarás.
El cifrado de conocimiento cero elimina por completo la capacidad de la empresa para leer tus archivos. No hay promesa que romper, porque la capacidad nunca estuvo ahí.

Esa es la línea que traza esta comparación: promesa frente a arquitectura.

Las pruebas

Nivel 1. Pueden leer tus archivos, así que confías en una promesa

Google Drive. Google afirma con claridad que no usa el contenido de tu Workspace para entrenar Gemini ni otros modelos fuera de Workspace "sin permiso" (Google Workspace). Pero ese compromiso se limita al uso organizativo de Workspace, y Google tiene tus claves: Drive estándar se cifra en tránsito y en reposo con claves que gestiona Google, no de extremo a extremo, así que Google puede acceder al contenido. La única forma de hacer un archivo ilegible para Google es el cifrado del lado del cliente de Workspace, que es opcional, lo habilita el administrador y no está disponible para cuentas de consumo (Ayuda de Google Drive). En el lado de consumo, cuando tu ajuste Keep Activity está activado (antes Gemini Apps Activity), Google dice que usa tu actividad "para proporcionar, desarrollar y mejorar sus servicios (incluido entrenar modelos de IA generativa)", revisores humanos leen algunas conversaciones y se conservan hasta tres años aunque borres tu actividad, y Google advierte: "No introduzcas información confidencial que no quieras que vea un revisor" (Centro de privacidad de Gemini). Veredicto: promesa.

Microsoft OneDrive. Microsoft declara que, para clientes comerciales de Microsoft 365, "las instrucciones, las respuestas y los datos a los que se accede a través de Microsoft Graph no se usan para entrenar LLM base", y Graph cubre el contenido del tenant, incluidos archivos de OneDrive y SharePoint, correo, calendario y chats (privacidad de Microsoft 365 Copilot). En el lado de consumo es al revés: Microsoft dice que "usa datos de Bing, MSN, Copilot y las interacciones con anuncios de Microsoft para entrenar IA", algo activado por defecto en cuentas personales salvo que desactives los controles de entrenamiento (preguntas de privacidad de Microsoft Copilot). OneDrive se cifra en reposo con claves AES de 256 bits por archivo, pero Microsoft posee esas claves; no hay un modo de extremo a extremo solo para el usuario, y Copilot está construido explícitamente para razonar sobre tus archivos, correo y chats (cifrado de datos en OneDrive y SharePoint). Veredicto: promesa.

Dropbox. Tras una reacción en diciembre de 2023 por un ajuste de IA de terceros, Dropbox dijo que la IA de terceros solo se usa cuando activas una función de IA, que nada envía pasivamente tus datos a un tercero, y que los archivos enviados a su socio OpenAI se eliminan en 30 días y no se usan para entrenar los modelos de OpenAI (The Register, dic 2023). Esa es una vía. La otra: Dropbox sí entrena sus propios modelos de aprendizaje automático con tu contenido. Su FAQ de privacidad indica que "estos modelos pueden entrenarse con tus documentos y metadatos, y potencian funciones dentro de Dropbox como la relevancia de búsqueda, el autoordenado y los resúmenes de documentos" (FAQ de privacidad de Dropbox). Sus Principios de IA se comprometen a no "construir modelos de IA generativa con contenido de clientes sin consentimiento", un compromiso limitado a la IA generativa que no cubre el entrenamiento anterior (Principios de IA de Dropbox). Dropbox cifra tus archivos pero tiene las claves y no ofrece cifrado de extremo a extremo en poder del usuario (cómo Dropbox protege tus archivos). Veredicto: promesa, y ya entrena sus propios modelos con tus archivos para funciones.

pCloud. pCloud se promociona como respetuoso con la privacidad, pero su cifrado de extremo a extremo, llamado pCloud Encryption o Crypto, es un complemento de pago opcional que solo se aplica a los archivos que mueves a una carpeta Crypto especial (pCloud Encryption). Todo lo de tu almacenamiento normal se cifra solo en tránsito y en reposo con claves que tiene pCloud, lo que significa que pCloud puede leerlo técnicamente (seguridad de pCloud). El software de producción es además de código cerrado, así que el cifrado no puede verificarse de forma plenamente independiente, aunque pCloud sí publicó el código de su cliente Crypto móvil para un concurso "Crypto Challenge" de 2015 a 2016. Veredicto: promesa por defecto. Arquitectura solo dentro de una carpeta de pago.

Nivel 2. Arquitectura, pero solo si te suscribes

Apple iCloud. Apple es el más fuerte de los grandes. Con la Protección de Datos Avanzada activada, Apple dice que 25 categorías de datos de iCloud quedan cifradas de extremo a extremo, añadiendo Copia de iCloud, iCloud Drive, Fotos, Notas y más, y que "nadie más puede acceder a tus datos cifrados de extremo a extremo, ni siquiera Apple" (resumen de seguridad de datos de iCloud). El truco es que la ADP es opcional y está desactivada por defecto. Sin ella, 15 categorías más iMessage y FaceTime ya están cifradas de extremo a extremo, pero del resto Apple puede descifrar tus datos en tu nombre, y Mail, Contactos y Calendarios de iCloud nunca están cifrados de extremo a extremo, ni siquiera con ADP. La función ha atraído presión gubernamental: el Reino Unido ordenó acceso bajo la Investigatory Powers Act, Apple retiró la ADP para usuarios del Reino Unido en febrero de 2025, y a fecha de junio de 2026 las páginas de soporte de Apple siguen marcando la ADP como no disponible para usuarios del Reino Unido (soporte de Apple). Por separado, Apple dice que Apple Intelligence se ejecuta en el dispositivo o vía Private Cloud Compute, donde "tus datos nunca quedan accesibles para Apple", y que "no usamos los datos personales privados de nuestros usuarios ni sus interacciones para entrenar nuestros modelos base" (funciones de privacidad de Apple). Veredicto: arquitectura si activas la ADP. Si no, una promesa.

Nivel 3. Conocimiento cero por defecto, que es arquitectura

MEGA. MEGA cifra los archivos en tu dispositivo antes de subirlos, con claves derivadas de tu contraseña que, según MEGA, nunca salen de tu dispositivo, y sobre esa base afirma que no puede descifrar ni ver tus archivos, lo que significa que no puede escanearlos ni entrenar IA con ellos. Dos matices lo mantienen honesto. Primero, las apps cliente de MEGA son de código disponible más que plenamente de código abierto: el código está en GitHub para revisión y uso no comercial bajo la propia Code Review Licence de MEGA, no una licencia aprobada por la OSI (código fuente de MEGA). Segundo, en 2022 criptógrafos de ETH Zúrich documentaron fallos (la investigación "MEGA: Malleable Encryption Goes Awry", presentada después en IEEE S&P 2023) que, en teoría, permitirían a una entidad que controlara la propia infraestructura de servidores de MEGA recuperar la clave privada de un usuario tras varios inicios de sesión y descifrar sus archivos. MEGA parcheó los ataques revelados en el mismo mes, junio de 2022, y dijo que no constaba ninguna cuenta comprometida (actualización de seguridad de MEGA); los investigadores reconocieron que el parche bloqueó su prueba de concepto pero lo calificaron de medida más estrecha que el rediseño que recomendaban (The Register). MEGA sigue siendo mucho más privado que las nubes generalistas, pero el episodio recuerda que una afirmación de conocimiento cero solo es tan fuerte como el diseño criptográfico que la sostiene, por lo que importa la verificación independiente. Veredicto: arquitectura, con una advertencia documentada y ya parcheada.

Proton Drive. Proton Drive está cifrado de extremo a extremo, con acceso cero, por defecto en todos los planes, incluido el gratuito, y cifra los nombres de archivo y los metadatos además del contenido; sus clientes son de código abierto y ha sido auditado de forma independiente por Securitum, con la app web auditada en 2021 y las apps móviles en 2022 (seguridad de Proton Drive). Proton declara que "nunca escanea ni usa el contenido de tus archivos para IA ni para ningún otro fin" (Proton Drive para empresas), y sus propias funciones de IA no entrenan con tu contenido: Proton Docs dice que tu trabajo "nunca se usará para entrenar modelos de IA" (Proton Docs). Con sede en Suiza y más de 100 millones de cuentas. Veredicto: arquitectura, por defecto.

El patrón: las promesas de privacidad tienen una vida media corta

La razón por la que "no entrenamos con tus datos" nunca debería bastar por sí sola: el historial de esa promesa es desigual, y los términos no dejan de moverse en ambas direcciones.

Adobe se enfrentó en 2024 a la rebelión de profesionales creativos por unos términos que parecían reclamar derechos sobre su trabajo, y aclaró que el contenido de clientes "nunca se usará para entrenar ninguna herramienta de IA generativa", con una excepción para el contenido enviado a Adobe Stock (Adobe). Esa es la dirección que quieren los usuarios.
Meta, Google y Snap fueron en la dirección contraria, abriendo el entrenamiento con el contenido público de los usuarios y sus interacciones con asistentes de IA. Meta reanudó el entrenamiento de su IA con publicaciones públicas de adultos en la UE desde mayo de 2025, con un formulario de objeción (Meta). La política de privacidad de Google dice que usa "información disponible públicamente" y "tus interacciones con modelos y tecnologías de IA como Gemini Apps" para entrenar sus modelos (Google). Snap dice que puede usar contenido "que hayas publicado públicamente en Snapchat" para entrenar su IA generativa, con una exclusión en los ajustes (Snap). Ninguno afirma entrenar con tus mensajes privados, y cada uno ofrece una exclusión, pero el valor por defecto se movió.
X empezó a usar publicaciones públicas para entrenar Grok tras su lanzamiento en noviembre de 2023, fue adquirida por xAI en marzo de 2025 y, bajo sus Términos de Servicio vigentes desde enero de 2026, amplió la definición de "Contenido" para incluir las instrucciones y salidas de IA, con los usuarios concediendo una licencia amplia que incluye entrenar sus modelos (Términos de Servicio de X). Hay una exclusión en los ajustes, los chats privados de Grok quedan excluidos y las publicaciones públicas de la UE y el EEE se exceptuaron tras la intervención de un regulador en 2024. Esta es la historia del riesgo de adquisición en una sola.
Zoom (2023) y Mozilla/Firefox (2025) provocaron reacciones por términos que parecían ampliar el uso de datos para IA. Zoom dio marcha atrás en días, declarando al final de forma incondicional que "no usa ningún contenido de cliente de audio, vídeo, chat, pantalla compartida, adjuntos u otras comunicaciones para entrenar los modelos de inteligencia artificial de Zoom ni de terceros" (Zoom). Mozilla reescribió su licencia tras la reacción (Mozilla).
La Comisión Federal de Comercio de EE. UU. ha advertido que reescribir tus términos en silencio puede ser en sí mismo un problema. En una publicación de febrero de 2024 titulada "AI (and other) Companies: Quietly Changing Your Terms of Service Could Be Unfair or Deceptive", la FTC dijo que "puede ser injusto o engañoso que una empresa adopte prácticas de datos más permisivas ... e informe a los consumidores de este cambio solo mediante una enmienda subrepticia y retroactiva de sus términos de servicio o política de privacidad".

La mayoría de estos casos empezaron como "nunca lo haríamos". Una promesa solo es tan duradera como la siguiente decisión de negocio.

Dónde encaja ShieldFive

ShieldFive pertenece al tercer nivel: conocimiento cero por diseño. Tus archivos se cifran en tu navegador, con claves que solo tú posees, antes de que lleguen a nosotros. Solo podemos llegar a tener texto cifrado, lo que significa que no podemos entrenar IA con tus archivos, no podemos escanearlos, no podemos entregarlos a un tercero y no se nos puede obligar a ello, ni siquiera por un tribunal o un futuro comprador. No hay ningún ajuste que configurar mal ni promesa que romper.

No somos el único servicio que puede decir eso. Proton Drive es un par genuino de conocimiento cero, y MEGA también con la advertencia anterior, y preferimos decírtelo a fingir lo contrario. La propiedad de no usar IA y no escanear la comparten en general los sistemas de conocimiento cero; no es exclusiva nuestra. En lo que nos centramos es en unas pocas cosas concretas:

Cifrado post-cuántico por defecto. Cada subida nueva se cifra con una suite híbrida, ML-KEM-1024 (FIPS 203, el nivel post-cuántico más alto del NIST) combinada con un cifrado clásico, de modo que romper uno solo de los componentes no expone el archivo. Este es nuestro verdadero diferenciador, no la propiedad de no escanear.
Un núcleo criptográfico abierto que puedes comprobar. La biblioteca de cifrado, @shieldfive/crypto, se publica bajo Apache-2.0, y su especificación y sus vectores de prueba legibles por máquina son públicos en el repositorio de código, de modo que una implementación independiente puede reproducir nuestras salidas byte a byte. La biblioteca está actualmente en beta y ha completado una revisión interna, todavía no una auditoría externa por un tercero; preferimos decirlo con claridad a insinuar una certificación que no hemos ganado.
Residencia de datos en la UE. Los datos de archivo cifrados se almacenan en la UE, bajo jurisdicción de la UE y el RGPD.

No te pedimos que confíes en que no lo haremos. Eliminamos nuestra capacidad de hacerlo.

Ni siquiera nosotros podemos leer tus archivos.

La manera de evaluar esto es en la práctica. El nivel gratuito de ShieldFive es de 20 GB sin tarjeta, suficiente para probar el flujo con archivos no críticos primero, subir, compartir con caducidad, revocar, antes de mover nada que importe.

Preguntas frecuentes

¿Puede mi proveedor de nube entrenar IA con mis archivos?

Si el proveedor tiene tus claves de cifrado, puede leer tus archivos, y todo lo que puede leer puede en principio entregárselo a un modelo. La mayoría de los grandes proveedores dicen que hoy no entrenan sus modelos con los archivos que almacenas, pero eso es una política que pueden revisar. Un proveedor de conocimiento cero no puede, porque solo llega a tener texto cifrado. La pregunta que protege no es "¿lo hacen?", sino "¿podrían, si lo decidieran?".

¿Qué servicios de almacenamiento no pueden entrenar IA con mis archivos?

Los servicios genuinamente de conocimiento cero no pueden, porque las claves de cifrado nunca salen de tu dispositivo y el servidor solo guarda texto cifrado. Proton Drive y ShieldFive son de conocimiento cero por defecto, y MEGA también, con una advertencia criptográfica documentada de 2022 que MEGA ya ha parcheado. Apple iCloud alcanza ese umbral solo si activas la Protección de Datos Avanzada, que está desactivada por defecto. Google Drive, OneDrive, Dropbox y el almacenamiento estándar de pCloud tienen todos tus claves.

¿Google Drive o Microsoft OneDrive usan mis archivos para entrenar IA?

Ambos dicen que el contenido organizativo no se usa para entrenar sus modelos base: Google para Workspace, Microsoft para los datos de tenant de Microsoft 365. Pero ambos tienen tus claves y pueden leer tus archivos, y ambos entrenan con algunos datos de superficies de consumo, Google mediante el Gemini de consumo cuando Keep Activity está activado, Microsoft mediante Bing, MSN y el Copilot de consumo salvo que te excluyas. La protección es una política, no la arquitectura.

¿Dropbox entrena IA con mis archivos?

Dropbox se compromete a no construir IA generativa con tu contenido sin consentimiento, y dice que los archivos enviados a su socio de IA de terceros no se usan para entrenar los modelos de ese socio. Por separado, su propia FAQ de privacidad indica que entrena sus propios modelos no generativos con tus documentos y metadatos para potenciar la búsqueda, la organización y los resúmenes. Dropbox tiene tus claves, así que la protección es una promesa de política.

¿El cifrado de conocimiento cero detiene el entrenamiento de IA?

Sí, a nivel de arquitectura. En un sistema de conocimiento cero, los archivos se cifran en tu dispositivo antes de subirlos y las claves nunca llegan al proveedor, así que el servidor guarda solo texto cifrado. No hay nada legible que escanear o con lo que entrenar, y una orden judicial solo devuelve texto cifrado. Eso es una garantía estructural, no una política que pueda cambiarse en silencio.

¿ShieldFive entrena IA con mis archivos?

No, y no es cuestión de política. Los archivos se cifran en tu navegador antes de subirlos, ShieldFive solo llega a tener texto cifrado, y las claves nunca llegan a nuestros servidores, así que no hay nada que podamos leer, escanear o con lo que entrenar. El núcleo criptográfico es de código abierto y sus vectores de prueba son públicos para que puedas verificar el diseño, los datos cifrados se almacenan en la UE y el cifrado post-cuántico es el valor por defecto en cada subida nueva.

Esta comparación refleja los términos y la documentación públicos de cada proveedor a fecha de 2026-06-24 y se actualizará a medida que cambien los términos. Los términos de servicio en la nube cambian constantemente, que es justo el sentido de esta página. Antes de fiarte de una sola línea de aquí, consulta los términos actuales del proveedor a través de los enlaces. Si detectas algo desactualizado, dínoslo y lo corregiremos.