- El pangenoma del pepino integra 39 genomas y casi 172.000 variantes estructurales, revelando con detalle su diversidad genética.
- La domesticación ha eliminado muchas variantes estructurales dañinas, mientras que se han acumulado SNPs ligeramente perjudiciales durante la expansión.
- Este conocimiento permite mejorar la predicción genómica y diseñar variedades con mejor calidad de fruto y mayor resiliencia.
- La edición génica tipo CRISPR en genes como eIF4E ya ha logrado resistencias a virus en pepino sin recurrir a transgénesis.

Detrás de un simple pepino de la frutería hay una historia genética muchísimo más compleja de lo que parece a primera vista. Formas más o menos alargadas, piel lisa o con espículas, presencia de cavidades en la pulpa o resistencia a determinados virus no son fruto del azar, sino del resultado de miles de años de evolución, domesticación y mejora dirigida por el ser humano.
En los últimos años, un conjunto de estudios punteros ha permitido dibujar el mapa genético más completo del pepino, pasando de tener solo un genoma de referencia a disponer de un auténtico pangenoma que recoge casi toda la variación genética conocida de la especie. Este salto abre la puerta a diseñar variedades con mejor sabor, mayor calidad comercial y más resiliencia, reduciendo muchísimo el ensayo y error de la mejora clásica.
Qué es el pangenoma del pepino y por qué es un avance tan grande
Para entender la magnitud del hallazgo, conviene aclarar primero qué significa eso de construir un pangenoma del pepino. Tradicionalmente, cuando se decía que se había secuenciado el genoma de un cultivo, se hablaba del ADN de una sola variedad de referencia, algo así como la “edición estándar” del libro genético de la especie.
El problema es que ese enfoque deja fuera gran parte de la diversidad genética real que existe entre distintas variedades, líneas de mejora y parientes silvestres. Cada tipo de pepino puede albergar genes ausentes en otros, reorganizaciones del ADN o regiones que se han perdido o ganado a lo largo de la domesticación y la adaptación a diferentes climas y sistemas de cultivo.
Para superar esa limitación, un equipo internacional liderado por el profesor Zhangjun Fei, del Boyce Thompson Institute (BTI), recopiló y analizó 39 genomas de pepino de alta calidad. Con esa información generaron un pangenoma basado en grafos, una representación donde se integran simultáneamente todas las variantes y rutas posibles que puede seguir el ADN de la especie, en lugar de una única “línea” de referencia.
Este pangenoma del pepino ha permitido localizar cerca de 171.892 variaciones estructurales (SVs) en el genoma, es decir, grandes inserciones, deleciones, duplicaciones e inversiones de fragmentos de ADN que van mucho más allá de los típicos cambios de una sola letra (SNPs). Estas SVs han tenido un papel determinante tanto en la evolución natural del pepino como en su mejora agrícola.
A diferencia de los estudios clásicos centrados casi en exclusiva en SNPs, este trabajo muestra con gran claridad que las variantes estructurales desempeñan un papel clave en rasgos agronómicos esenciales, desde la forma del fruto hasta la presencia de cavidades internas, pasando por adaptación a distintos ambientes y respuesta al estrés.
Un cultivo clave: importancia económica y productiva del pepino
El pepino (Cucumis sativus) es mucho más que un ingrediente para ensaladas: se trata de una de las hortalizas más producidas del planeta. A escala mundial ocupa el tercer puesto en volumen de producción hortícola, solo por detrás del tomate y la cebolla, formando parte de la amplia familia de las cucurbitáceas, donde también se incluyen el melón, la sandía y las diferentes calabazas.
Las cucurbitáceas, en conjunto, utilizan alrededor de nueve millones de hectáreas de superficie agrícola repartidas por todo el mundo y generan aproximadamente 184 millones de toneladas de fruto al año. Pese a esa importancia económica, durante mucho tiempo el conocimiento genético de estos cultivos se quedó muy por detrás del que se tenía de otras especies como el arroz, el trigo o la uva.
En el caso concreto del pepino, los productores se enfrentan a retos continuos: necesitan variedades más resistentes a enfermedades y estrés abiótico, frutos con mejor conformación y menos defectos internos, y una calidad organoléptica (sabor, textura, aroma) que satisfaga a consumidores muy exigentes en mercados globalizados.
Hasta hace relativamente poco, los programas de mejora dependían en gran parte de cruzamientos, selección visual y mucha experiencia, lo que implica ciclos largos, resultados a veces imprevisibles y el riesgo de arrastrar características indeseadas junto con rasgos positivos. La disponibilidad del genoma y, ahora, del pangenoma del pepino, está revolucionando esa forma de trabajar.
Del primer mapa genético del pepino al pangenoma basado en grafos
El camino hasta disponer de un pangenoma tan completo comenzó con la primera secuenciación del genoma del pepino, lograda por un consorcio internacional liderado por el Instituto de Genómica de Pekín (BGI) y la Universidad de California-Davis. En esa colaboración participaron también laboratorios de Países Bajos, Dinamarca, Corea del Sur y Australia.
Aquel trabajo pionero reveló que el genoma del pepino contiene alrededor de 245 millones de pares de bases, es decir, 245 millones de “escalones” en la doble hélice de ADN. Gracias a las tecnologías de secuenciación de nueva generación y a estrategias de ensamblaje cada vez más refinadas, fue posible obtener esta secuencia con un coste y un tiempo mucho más reducidos que en proyectos genómicos anteriores.
La publicación de este genoma en la revista Nature Genetics supuso un hito: el pepino se convirtió en la séptima planta de cultivo con su secuencia genómica completa disponible, después de especies tan estudiadas como Arabidopsis thaliana, el álamo, la vid, la papaya, el arroz y el sorgo. A partir de ahí, se abrió una puerta para comprender mejor la biología de toda la familia de las cucurbitáceas.
Contar con ese primer mapa genético permitió estudiar rasgos clave muy valorados por el sector: tamaño y forma del fruto, coloración de la piel, resistencia a enfermedades, determinación del sexo de las flores o diferencias en perfil nutricional y organoléptico entre variedades. La idea de fondo era utilizar este conocimiento para diseñar pepinos más productivos, sabrosos y adaptados a condiciones ambientales cambiantes.
Con el paso del tiempo, y a medida que la tecnología de secuenciación fue abaratándose todavía más, los investigadores pudieron dar el salto desde un genoma único a la construcción de un pangenoma completo apoyado en múltiples líneas de pepino. Esta nueva fase ha sido la que realmente ha permitido capturar la diversidad genética profunda de la especie.
Variantes estructurales frente a SNPs: una “limpieza” genética a lo largo de la evolución
Durante años, muchos estudios se centraron casi exclusivamente en las pequeñas variaciones de una sola base, los SNPs (polimorfismos de un solo nucleótido). Son cambios mínimos en la secuencia del ADN, a menudo neutros o con efectos muy sutiles, que han servido para trazar mapas de ligamiento, estudios de asociación y análisis de diversidad.
Sin embargo, el análisis del pangenoma del pepino ha puesto sobre la mesa que las variantes estructurales (SVs) de mayor tamaño han tenido un impacto mucho más decisivo en la evolución de este cultivo. Estas SVs incluyen grandes inserciones y deleciones, inversiones de segmentos completos del genoma y reorganizaciones que alteran porciones enteras de cromosomas.
El equipo liderado por Zhangjun Fei observó que, a lo largo de la domesticación, el genoma del pepino ha sufrido una auténtica depuración genética. Mientras que una parte considerable de los SNPs, incluso los ligeramente perjudiciales, se han ido acumulando y conservando, muchas variantes estructurales dañinas han sido eliminadas de manera sistemática por la selección natural y la selección ejercida por el ser humano.
Cuando el pepino se expandió desde su región de origen en la India hacia otras zonas de Asia, Europa y América, se produjo lo que se conoce como “carga de expansión”. Durante este proceso, se acumularon SNPs con efectos negativos leves en las poblaciones que colonizaban nuevas áreas. En cambio, las variantes estructurales siguieron un patrón muy distinto: las más perjudiciales continuaron siendo purgadas generación tras generación.
Como consecuencia, las SVs que aún se encuentran en las poblaciones modernas de pepino suelen ser más recientes que buena parte de los SNPs y en muchos casos presentan efectos funcionales específicos sobre rasgos agronómicos. Este contraste indica que las SVs, al implicar cambios grandes, tienden a ser más arriesgadas para la viabilidad de la planta, por lo que la selección actúa con más intensidad sobre ellas.
Flujo génico, introgresiones silvestres y “lastre” genético oculto
Otro resultado interesante del análisis del pangenoma fue la detección de flujo génico desde poblaciones silvestres de pepino hacia variedades cultivadas, especialmente hacia tipos europeos. Este intercambio genético se conoce como introgresión e implica la incorporación de segmentos de ADN procedentes de parientes no domesticados.
Estas introgresiones han podido introducir en los pepinos cultivados rasgos muy valiosos, como una mejor tolerancia a sequía, resistencia a determinadas enfermedades o adaptación a suelos y climas específicos. Los mejoradores llevan décadas recurriendo a los parientes silvestres precisamente para rescatar genes que ya no estaban presentes en las variedades comerciales.
El estudio del pangenoma muestra, sin embargo, que este proceso no siempre es tan limpio como se desearía. Junto a los genes favorables, en esas regiones introgresadas pueden viajar variantes estructurales con efectos negativos que quedan “enganchadas” físicamente a fragmentos del genoma con características positivas.
Este “lastre genético” puede traducirse en problemas como menor vigor, susceptibilidad a otros estreses o aparición de defectos en el fruto, que a primera vista no se relacionan con el gen de interés introducido. El pangenoma, al detallar la posición y naturaleza de las SVs, proporciona un mapa muy fino para detectar y separar el grano de la paja.
Con esta información, los programas de mejora pueden diseñar estrategias más sofisticadas para conservar los genes beneficiosos de parientes silvestres y, al mismo tiempo, ir eliminando o reduciendo la frecuencia de las variantes estructurales dañinas asociadas, algo prácticamente imposible de hacer de forma eficiente sin este nivel de resolución genética.
Aplicaciones prácticas: predicción genómica y nuevas variedades de pepino
Todo este conocimiento no se queda en el laboratorio: tiene consecuencias muy directas en la mejora moderna del pepino. Uno de los avances más claros del estudio publicado en Nature Genetics es la integración de la información sobre variantes estructurales en los modelos de predicción genómica.
La predicción genómica utiliza datos de marcadores dispersos por todo el genoma para anticipar el comportamiento de cada planta antes incluso de sembrarla en el campo. En el caso del pepino, el equipo de investigación demostró que incluir en estos modelos el nivel de “carga” de SVs potencialmente dañinas mejora significativamente la capacidad de predecir rasgos relevantes.
Entre los caracteres evaluados se encuentran aspectos tan importantes como la forma del fruto, la presencia de cavidades internas (un defecto comercial relevante) y otros atributos de calidad y rendimiento. De este modo, los obtentores pueden seleccionar desde etapas muy tempranas las líneas que ofrecen un mejor equilibrio entre productividad, calidad y estabilidad genética.
Este enfoque hace que el desarrollo de nuevas variedades sea mucho más eficiente y rápido, ya que se reduce la dependencia de grandes ensayos a campo y se minimiza el componente de ensayo y error. Además, al conocer de antemano qué combinaciones de variantes estructurales conviene evitar, disminuye el riesgo de que aparezcan problemas inesperados en fases avanzadas de un programa de mejora.
En conjunto, el uso del pangenoma como herramienta básica permite a la mejora genética del pepino pasar de un modelo basado en una referencia única a un enfoque que aprovecha realmente toda la diversidad disponible, tanto de variedades comerciales como de materiales silvestres y tradicionales.
Edición genética y resistencia a virus en pepino sin transgénesis
Paralelamente al desarrollo del pangenoma, la mejora del pepino también se está beneficiando de los avances en tecnologías de edición génica como CRISPR/Cas9. Un trabajo destacado, llevado a cabo por Jeyabharathy Chandrasekaran y colaboradores en el Centro Volcani (Israel), demuestra el potencial de estas herramientas para generar resistencia a virus sin introducir genes externos.
En este estudio se utilizó el sistema Cas9 junto con ARNs subgenómicos (sgRNA) dirigidos específicamente al gen eIF4E, un gen recesivo del pepino que desempeña un papel clave en la infección por ciertos virus. Mediante esta edición, se diseñaron roturas y pequeñas modificaciones en regiones concretas del gen, con el objetivo de interrumpir su función sin afectar de forma negativa al resto de la planta.
Las plantas de la primera generación transformada (T1) mostraron deleciones pequeñas y SNPs en las zonas diana del gen eIF4E, y los análisis indicaron la ausencia de efectos fuera de los sitios previstos (off-target). A partir de estas líneas T1 se seleccionaron individuos heterocigotos para avanzar hacia generaciones siguientes.
Tras varios ciclos de cruce y selección, se lograron plantas homocigotas en la tercera generación (T3) que conservaban las mutaciones deseadas en eIF4E, pero sin contener inserciones de ADN de Cas9 ni otros elementos transgénicos. Es decir, se obtuvieron líneas mejoradas por edición génica que, desde el punto de vista regulatorio y técnico, pueden considerarse no transgénicas.
El resultado fue contundente: las plantas T3 homocigotas editadas mostraron inmunidad frente al virus de las venas amarillas del pepino (CVYV) y resistencia significativa frente al virus del mosaico amarillo de la calabaza (ZYMV) y al biotipo W del virus de la mancha anillada de la papaya (PRSV-W). En cambio, las plantas heterocigotas y las no mutantes resultaron muy susceptibles a estos patógenos.
Este trabajo demuestra que es posible desarrollar resistencia a virus en pepino sin recurrir a la transgénesis clásica ni a largos ciclos de retrocruzamiento, lo que abre una vía muy interesante para reducir pérdidas por enfermedades y disminuir el uso de fitosanitarios. Además, la misma estrategia podría ampliarse a un amplio abanico de cultivos y objetivos de mejora.
Impacto en otras cucurbitáceas y perspectivas de futuro
El conocimiento generado a partir del genoma y el pangenoma del pepino no se limita a esta especie. Dado que comparte familia con el melón, la sandía y las calabazas, muchas de las metodologías, herramientas bioinformáticas y enfoques conceptuales aplicados aquí son extrapolables a otras cucurbitáceas de interés comercial.
De hecho, la secuenciación de distintos genomas vegetales en las últimas décadas —como los de la patata, el melón, el sorgo, la uva o el trigo— ha puesto de manifiesto que los mapas genéticos de los alimentos son una pieza clave para asegurar la producción futura en un contexto de cambio climático, presión de plagas emergentes y necesidad de reducir insumos.
En el caso del pepino, la combinación de pangenómica, edición génica y modelos avanzados de predicción tiene el potencial de cambiar radicalmente la forma de diseñar nuevas variedades. En lugar de seleccionar a ciegas sobre el fenotipo observado, los mejoradores pueden apoyarse en información muy precisa sobre qué regiones del genoma les conviene mantener, modificar o eliminar.
A medio plazo, es razonable pensar que veremos pepinos más adaptados a condiciones extremas, capaces de soportar olas de calor, disponibilidad irregular de agua o nuevos patógenos, sin renunciar por ello a la calidad sensorial ni al rendimiento. Asimismo, la posibilidad de modular caracteres como la aparición de cavidades internas, la firmeza o el contenido nutritivo permitirá responder con agilidad a las demandas específicas de distintos mercados.
En definitiva, todo este esfuerzo en descifrar y ordenar el ADN del pepino está allanando el camino hacia un modelo de agricultura más precisa, en el que cada decisión de mejora y manejo se basa en un conocimiento profundo de la genética de las plantas. Lo que antes era un simple listado de variedades en un catálogo se está transformando en un repertorio de combinaciones genéticas cuidadosamente diseñadas para rendir al máximo en cada entorno y sistema productivo.
Que hoy podamos hablar de un pangenoma del pepino tan detallado, de casi 172.000 variantes estructurales identificadas y de líneas resistentes a virus generadas por edición sin transgénesis muestra hasta qué punto la genómica aplicada a la agricultura ha pegado un salto en muy poco tiempo; a partir de ahora, la mejora de este cultivo tendrá una base científica mucho más sólida para ofrecer pepinos más sabrosos, homogéneos y resistentes en los invernaderos y campos de todo el mundo.