Paste
Copy
Cut
Options

¡Tu solución está lista!

Nuestra ayuda de expertos desglosó tu problema en una solución confiable y fácil de entender.

Mira la respuesta
  • Pregunta: Tarea: búsquedas de similitud en bases de datos Para esta tarea debe preparar un informe con las respuestas a varias preguntas. ¡Lea la tarea primero antes de comenzar! ¡No olvides agregar tu nombre en la portada! En esta tarea, aprenderá a usar Blast para búsquedas de similitud en las bases de datos de secuencias. Específicamente, buscará bases de datos de

    Tarea: búsquedas de similitud en bases de datos

    Para esta tarea debe preparar un informe con las respuestas a varias preguntas.

    ¡Lea la tarea primero antes de comenzar! ¡No olvides agregar tu nombre en la portada!

    En esta tarea, aprenderá a usar Blast para búsquedas de similitud en las bases de datos de secuencias. Específicamente, buscará bases de datos de proteínas.

    Hemos clonado un nuevo ADNc de ratón y tiene un marco de lectura abierto. Nos gustaría obtener tanta información como podamos al respecto.

    Esta es la secuencia traducida:

    MKRKFVGAAIGGALAVAGAPVALSAVGFTGAGIAAGSIAAKMMSAAAIANGGGIAAGGLVATLQSVGVLG

    LSTITNIILVAVGTATGARAEGSMGASREQESGPQDPPQELQEPQEPPSCKKQDLNLGKFVGAAIGGALA

    VAGAPIALSAVGFTGAGIAAGSIAAKMMSAAAIANGGGIAAGGLVATLQSVGILGLSTSTNIILGAVGAA

    TGATAAGAMGACREQEPGLQDLQQEPKEPQEPQELQKQQEPQEPQELQKQQETQETQETQELQKTQEPPS

    Usaremos servidores web para las búsquedas masivas.

    No cierre las ventanas después de ejecutar las búsquedas, ¡es posible que tenga que volver a mirarlas más tarde! (Alternativamente, puede asignar nombres a las búsquedas y hacer clic en los resultados recientes en un cuadro gris en la parte superior de la página para volver a las búsquedas anteriores)

    Abre la url Blast

    Ir a la página de explosión de proteínas.

    Ejecute una búsqueda usando todos los siguientes parámetros:

    • base de datos NR
    • el algoritmo blastp
    • con el filtro puesto
    • con la matriz blosum62

    Para ver todos los parámetros, haga clic en Parámetros del algoritmo en la parte inferior de la página.

    Después de asegurarse de que tiene todos los parámetros anteriores, haga clic en el botón de explosión (ya sea en el medio o en la parte inferior de la página, no hay diferencia).

    De la salida gráfica, ¿qué dominio conservado hay en nuestra proteína? (Puede hacer clic en él para obtener el nombre completo). ¿De dónde a dónde en nuestra proteína es (aproximadamente)?

    Continuando con la visualización gráfica de resultados, ¿qué tipos de cobertura de nuestra secuencia obtenemos?

    ¿Cuántos golpes hay? ¿En cuántas proteínas diana (cuenta la lista)? como puedes explicar esto? (Pista: mira las alineaciones...)

    ¿Cuántos resultados (de la lista) tienen una puntuación E de < 0,05?

    ¿Cuántos hits (de la lista) tienen 0.05 < E-score < 1.00 ?

    Mire las alineaciones de la primera proteína objetivo con una puntuación electrónica no significativa. ¿De dónde a dónde en nuestra proteína son los éxitos? ¿De dónde a dónde en la otra proteína? ¿Qué quiere decir esto?

    ¿Cuáles son las 5 mejores secuencias objetivo (de la lista)? Enumere sus números de acceso, descripciones y puntajes electrónicos

    Haga clic en el enlace de informes de taxonomía (encima de la imagen)

    ¿De qué organismos son los hits? (puedes dar nombres comunes)

    Ahora repetirá la búsqueda de Blast sin filtrar las regiones de "baja complejidad".

    Ejecute Blast nuevamente (¡recuerde eliminar el filtro!) y observe la salida.

    Mire la salida gráfica: ¿ha cambiado la cobertura? ¿Cómo?

    ¿Cuántos hits hay ahora?

    ¿Cuántos no son estadísticamente significativos?

    ¿Cuáles son los 5 mejores (de la lista)? Enumere sus números de acceso, descripciones y puntajes electrónicos

    ¿Cambiaron los 5 primeros con respecto a la carrera anterior? ¿De qué manera (mira las alineaciones también)? como puedes explicar esto?

    Mire el hit superior e ingrese la entrada RefSeq. ¿Cuál es su número de acceso? ¿De qué especie es? ¿Cuánto tiempo es? ¿Cual es su nombre? De acuerdo con el registro del genbank, ¿de dónde a dónde se encuentra el dominio que explotó?

    Ahora cambiaremos de base de datos: intentaremos las mismas búsquedas contra swissprot.

    Ejecute dos búsquedas explosivas contra swissprot, una con el filtro y otra sin él.

    ¿Cuántos aciertos hay, en cuántas proteínas, en las dos corridas?

    ¿Hay alguna secuencia con cobertura completa, en cualquiera de las dos carreras? ¿Por qué o por qué no?

    Compare las dos primeras secuencias objetivo: ¿Qué tienen de diferente (observe la lista y la alineación)? ¿Por qué?

    Mire el primer resultado NO significativo de la búsqueda sin el filtro.

    ¿Cual es su nombre? ¿Número de acceso? ¿Cuánto tiempo es? ¿Cuál es su E-score? ¿De qué organismo es? ¿Qué otra información puede obtener de su registro de genbank?

    ¿Te parece un verdadero éxito? ¿Por qué? ¿Que esta pasando aqui? (Sugerencia: ¿qué dice sobre la secuencia de entrada?)

    Ahora queremos verificar si nuestro último golpe es significativo.

    Ejecutaremos una alineación por pares con nuestra secuencia contra el último resultado de la búsqueda Blast sin el filtro.

    Ejecutaremos dos programas y compararemos los resultados entre sí.

    Abra una ventana para BL2Seq aquí. Asegúrese de estar en la página de BlastP. Puede encontrar un enlace para Agua de EMBOSS aquí. Puede encontrar Agua en la barra lateral a la izquierda debajo de Alineación local.

    Copie/pegue las dos secuencias (mantenga el mismo orden, será más fácil comparar los resultados) y responda las siguientes preguntas:

    Compara los dos programas. Tenga en cuenta la longitud de la alineación, de dónde a dónde está la alineación en cada secuencia, el % de similitud, la identidad y las lagunas.

    ¿Cómo son las alineaciones? (¿Es un área más similar que la otra? ¿Están los espacios agrupados?)

    ¿Crees que esta proteína es un verdadero éxito (un pariente lejano de nuestra secuencia original)? ¿Por qué o por qué no (tenga en cuenta todo lo que sabemos sobre estas proteínas; mire sus respuestas anteriores de toda la tarea para obtener pautas)?

  • Chegg Logo
    Esta es la mejor manera de resolver el problema.
    Solución

    Respuesta El nombre de dominio es proteína que contiene dominio Ifi -6-16 (es de

    Mira la respuesta completa
    answer image blur