Químio-Informática - Docking Flashcards
O que é Docking?
O Docking é uma técnica que se baseia em métodos computacionais para a previsão da interação não covalente entre um ligando (composto orgânico pequeno) e um recetor (macromolécula, como por exemplo uma proteína, sendo as enzimas o mais comum).
◦ Este foca/seleciona um conjunto de moléculas, para a qual a atividade biológica seja a mais elevada;
◦ Torna-se uma maneira de simular a interação com o alvo em questão, restringindo-se para as moléculas, as quais, pelo docking, deram melhores resultados.
Tabem pode ser usado para interpretar como é que é possível fazer simulações sem dados experimentais, prevendo forças intermoleculares, características do ligando que sejam relevantes na interação, entre outros.
O que é responsável pelo encaixe das moléculas em Docking?
As forças intermoleculares são as responsáveis pelo encaixe de moléculas pequenas em recetores biológicos.
O que se estuda com Docking? Porque que compostos costumam começar?
Tipicamente se estudam inibidores de enzimas, em que o ligando é uma molécula orgânica pequena e o recetor é uma macromolécula, tipicamente uma proteína. Estas podem ser enzimas, que é o mais habitual no ramo da farmacêutica, mas também se podem tratar de proteínas com outras funções biológicas, como de transporte. Tipicamente, quando se procede ao desenvolvimento de um fármaco, recorre-se a enzimas que, há partida, se sabe que pode estar relacionada com a doença. Temos que, se existe uma enzima num mecanismo de uma determinada doença, uma estratégia para o tratamento é a inibição desta com um inibidor, a atuar no centro ativo, inibindo assim a enzima fundamental e eliminar, assim o microrganismo.
O docking manual seria possível? Qual é a melhor maneira tho?
O docking manual é certamente possível utilizando programas gráficos (ex: QUANTA), mas são necessários algoritmos computacionais para pesquisar minuciosamente o espaço pré-definido. Neste ramo, apesar de ser possível realizar a análise manualmente, seria muito exaustivo e menos objetivo, logo, recorre-se à química computacional, onde, através de software, procura-se uma interação que minimize a energia de interação ao máximo, e compara-se esse parâmetro com várias moléculas.
Que questões ter em conta quando se faz pesquisa para docking?
→ Restringir a pesquisa para bons inibidores de alvos da doença (bibliotecas de triagem, design de bibliotecas combinatórias, sínteses específicas). Se é permitido selecionar um subconjunto de ligandos onde se encontra o inibidor é melhor do que tentar encontrar aleatoriamente;
→ Questão básica do reconhecimento do ligando quando a estrutura
do complexo é desconhecida.
Dá um exemplo de um problema computacional de docking.
Exemplo de problema computacional deste método: tendo em conta macromoléculas em meios aquosos, temos de simular efeitos de solvatação e temos de resolver, em tempo útil, a simulação de estruturas de proteínas. Sabemos, à partida, que se vai tratar de um processo muito demoroso.
Quais são os problemas relacionados com a flexibilidade em docking?
Na realidade, nem a macromolécula nem o ligando são rígidos: à volta das ligações ocorrem rotações que conduzem a conformações diferentes:
◦ No ligando os graus de liberdade podem ser poucos
◦ Na macromolécula são muitos, sendo que, explorar todas as conformações da macromolécula é muito difícil e complexo, no entanto, muito importante.
Existem sítios ativos da enzima muito específicos a um dado ligando, com características que fazem com que as moléculas interajam bem e outros ligandos semelhantes já não interajam, de todo. Estes locais, ou seja, os sítios ativos das enzimas não são rígidos, relevante para a maior parte das interações entre macromoléculas-ligandos.
Em simulações digitais, o que se faz para resolver o problema da flexibilidade em moléculas?
- Não considerar flexibilidade: partindo de estruturas rígidas (através bases de dados de cristalografia) onde
estão disponíveis as estruturas 3D das enzimas - Ligando flexível e recetor rígido: considera-se o recetor rígido, permitindo estudar a liberdade conformacional do ligando (+ comum). Exploram a flexibilidade do ligando fazendo variar a rotação através de 3-4 ligações, concluindo qual a melhor posição do ligando para se adaptar ao recetor. Exemplos:
◦ Fit to a fold “encaixar-se numa dobre” - Considerar o ligando e o recetor, sendo ambos flexíveis.
Tarefa: estudar a estrutura do ligando e encontrar rapidamente a pose correta de ligação. Isto é, encontrar o mais rápido possível a posição relativa do ligando ao recetor. Os algoritmos destes programas de docking têm 2 módulos críticos:
◦ Algoritmo de procura
◦ Função de ativação (scoring)
O que entendes por pKd e pki?
◦ pKd (constante de associação à enzima): mede a rigidez da ligação.
◦ pKi (constante de inibição à enzima): mede a capacidade de inibir.
Quais os 3 tipos de ação quando um ligando interage com um recetor?
→ Inibição competitiva (caso mais típico de docking): O ligando interage com o centro ativo, competindo com os ligandos naturais. Por sua vez, o inibidor que se liga ao centro ativo, impede que o ligando natural se ligue no mesmo local, bloqueando a função da enzima, enquanto o ligando estiver lá presente.
→ Inibição alostérica (liga-se a diferentes encaixes “pocket”): O inibidor liga-se a outro lado que não é o centro ativo. Quando isto acontece, pode alterar a forma da enzima, tal que o centro ativo fique indisponível.
→ Ativação alostérica. Algo se liga longe do sítio ativo para que este possa acomodar o ligando.
Problema de minimização de energia em docking:
A geometria deve apresentar o mínimo de energia de Gibbs. Os programas servem para encontrar a conformação com a energia mínima do sistema. O que acontece é que trabalhamos com macromoléculas complexas e a interação é feita num meio aquoso, sendo computacionalmente exigente. É preciso simplificar os métodos para que se consiga resolver o problema a tempo útil e ter modelos suficientemente rigorosos, com um nível de teoria relativamente baixo, para que seja possível a aplicação a um conjunto de moléculas grandes.
Explicita o que entendes e o que aocntece no processo de Searching configurações em Docking.
◦ Searching: procurar as geometrias possíveis para a interação. O objetivo desta procura é encontrar a orientação e a conformação de parceiros de ligação “binding partners”, que correspondem a um mínimo global de energia livre de ligação. Ou seja, é procurar geometrias possíveis para a interação.
→ Se as duas moléculas são consideradas rígidas, a procura consiste em fixar uma e fazer translações e rotações do outro ligando.
→ Se uma (ou as duas) são consideradas flexíveis, então é também preciso enumerar e variar as conformações possíveis para ambas e o problema é computacionalmente muito mais complexo, com um espaço de pesquisa muito maior.
Explicita o que entendes e o que aocntece no processo de Scoring configurações em Docking.
◦ Scoring: refere-se ao fato de que qualquer procedimento de docking deve avaliar e classificar as configurações geradas pelo processo de pesquisa. O melhor esquema de scoring seria prever a plausabilidade das interações com base no cálculo da energia livre de ligação (Gibbs), que não é facilmente acessível ao cálculo, obtendo um valor aproximado, mas não muito rigoroso, porque se trata de um meio biológico (aquoso). Portanto, as funções de scoring de aproximação devem ser usadas para modelar a energia livre de ligação (idealmente devem correlacionar com as afinidades de interação) para todas as poses testadas, sendo apenas viável, recorrendo a métodos de avaliação das poses muito simplificados.
No scoring, existem 3 aspetos importantes (objetivos):
1) Ordenar as várias configurações geradas pelo search docking para um ligando que interage em relação a uma proteína. Este aspeto é essencial para detetar o modo de ligação que melhor se aproxima da situação observada experimentalmente, assim como escolher a melhor configuração, e então, ordenar as poses de um ligando selecionado.
2) Ordenar diferentes ligandos em termos das suas afinidades para a mesma proteína: este aspeto é crucial em screening virtual.
3) Ordenar diferentes proteínas, em termos das suas afinidades, para o mesmo ligando. Este fator é crucial para avaliar seletividade e especificidade. Obtém-se números que permitam comparar a afinidade do mesmo ligando para proteínas diferentes, e então, prever se um determinado ligando se liga seletivamente a uma determinada proteína, muito importante para o design de fármacos, de modo a obter uma estrutura seletiva a uma macromolécula e não a outras, para não causar atividades paralelas não desejadas (toxicidade).
Quanto melhor for uma função de scoring, mais útil será par estes problemas.
Para a procura de um algoritmo, em Docking, temos os seguintes parâmetros a considerar:
→ Velocidade (exemplo: testar 5M de compostos ou mais em tempo útil).
→ Mínimos locais, em que os algoritmos devem explicar soluções que se afastem de mínimos locais (por exemplo: pode obter uma determinada afinidade, mas não ser a melhor de todas). O objetivo é enumerar soluções que não se fique naquelas que apresentam resultados medianos.
→ Espaço de pesquisa de alta dimensão
O que tem em conta a função de Scoring em Docking? O que controla e o que indica?
◦ Função de Scoring
→ Controlo rigoroso de falsos positivos, ou seja, previsões de que a interação seja muito favorável, quando se trata do contrário;
→ Boa correlação com pKd
→ Termos múltiplos, ou seja, a função de avaliação deve ter em conta muitos extremos (pontes de H, hidrofóbicas, van der Walls, repulsões estéreas);
→ Efeitos não aditivos (solvatação, interações hidrofóbicas).
Que notas são importantes ter em conta relativamente a Docking?
Nota 1: A atividade biológica não depende só do pKd. Este nem sempre corresponde à atividade, podendo não ter o efeito biológico procurado e ser necessário considerar outros fatores.
Nota 2: Preocupações de ADME – envolvidos no design do fármaco, onde os compostos têm de ser capazes de ser adsorvidos, boa distribuição para atuar no local pretendido, metabolização (toxicidade, degradação rápida ou lenta) e excreção.
Pergunta: Tendo acesso às 2 estruturas rígidas, deve-se procurar a rotação e translação do ligando ao recetor. Quantos parâmetros tem de ser otimizados/procurados, para termos a melhor interação?
Devemos otimizar as rotações (3, uma em cada eixo), assim como as translações (3, uma para cada eixo). Logo, deve-se procurar, no espaço, a 6 dimensões, resultando em 10^6 casos.
Como é que o programa representa do recetor (macromolécula)?
A representação de todos os átomos com as suas coordenadas, é geralmente impraticável, devido ao tamanho e a complexidade das estruturas das proteínas. Pelo que a informação estrutural deve ser reduzida
a um tamanho e forma controlada, mas representativos.
O 1º passo trata de limitar o estudo da macromolécula à zona em redor do local de ligação conhecido (infomação existente, ou programas para identificar locais de ligação). Ao obter uma estrutura de CRX, tendo a enzima e o ligando co cristalizados, eliminamos a estrutura do ligando, mantendo a zona ativa, e realiza-se a experiência com outros ligandos, sendo uma maneira experimental para obter sítios ativos, restringido a procura. Também é possível recorrer a programas que recorrem a dados experimentais com moléculas já existentes e preveem as cavidades mais prováveis de interação da macromolécula.
Mesmo a redução apenas a uma parte específica da proteína, ou seja, à zona de interação, não é suficiente para poderem ser usadas as coordenadas atómicas: o espaço é caracterizado por outros métodos mais eficientes. Isto é, uma representação simples em termos de coordenadas atómicas, não é praticável para a maioria dos procedimentos de docking. Mesmo assim o problema não fica completamente simplificado. Alternativas: (A primeira)
◦ Descritores geométricos da forma. A forma do espeço livre para a interação é caracterizada (Ligações H, aceitadores doadores à volta do estado livre), não se verificando, especificamente, como interage com o átomo, mas apenas vê se o ligando cabe ou não no espaço que está livre. Estes descritores vão definir a forma que o local de interação tem para depois verificar se o ligando consegue adaptar a sua forma para se conseguir adaptar.
Mesmo a redução apenas a uma parte específica da proteína, ou seja, à zona de interação, não é suficiente para poderem ser usadas as coordenadas atómicas: o espaço é caracterizado por outros métodos mais eficientes. Isto é, uma representação simples em termos de coordenadas atómicas, não é praticável para a maioria dos procedimentos de docking. Mesmo assim o problema não fica completamente simplificado. Alternativas: (A segunda)
Grade (“grid”), que se trata de um mapa de toda a zona de interação com valores de energia de interação calculados em cada ponto para um átomo-prova. A representação do recetor que usamos com o autodock é a caixa/grelha. Esta consiste num paralelepípedo, centrada num determinado ponto, normalmente no
ligando (já conhecido ou não), com uma determinada dimensão. Seguidamente, calculam-se as energias de interação entre cada átomo do ligando e a macromolécula em cada um dos pontos da caixa (dividida num determinado número de pontos) e, em cada um destes, pré-calculamos a energia de interação de um átomo de um determinado tipo (H de um carboxilo, C de um anel de benzeno, N de uma amina). Logo, pré-calculam-se as interações para cada átomo para cada ponto, e este conjunto de valores acaba por ser uma representação do espaço que cada um dos átomos pode ter a macromolécula, representando-a desta maneira. Assim, em vez vez se se calcular a energia com todos os átomos possíveis da molécula, calcula-se a energia global de interação através dos valores pré-calculados para a pose do ligando
Processamento de ligandos em Docking. Como é que o ligando é representado e processado?
O ligando é uma molécula muito mais pequena que a macromolécula respetiva e a representação destes átomos todos com as coordenadas 3D já é possível e é assim que é tipicamente processado.
◦ A representação de todos os átomos, com as suas coordenadas é perfeitamente possível.
◦ Os átomos de ligandos individuais são diretamente usados para verificar a coincidência com os descritores do local de ligação, ou para calcular a energia de interação nos casos de procedimentos movidos a energia.
◦ As interações são pré-calculadas antes da experiência do docking para facilitar a experiência.
◦ Maior problema: flexibilidade conformacional.
Estratégias de processamento de ligandos para combater a flexibilidade conformacional são quais?
Docking do ligando inteiro ou Docking de fragmentos do ligando.
Descreve o processamento de ligandos por docking do ligando inteiro.
Docking do ligando inteiro: aqui realiza-se o docking do ligando, admitindo uma estrutura rígida, para várias conformações, ou seja, realizam-se várias experiências de docking para cada conformação rígida.
→ Como rígido (apenas translações e rotações);
→ Só um confórmero ou vários confórmeros pré-calculados (estáveis);
→ Relaxação conformacional após docking inicial, ou seja, após o docking e obtenção da melhor conformação, já se considera a relaxação conformacional.;
→ Pesquisa do espaço conformacional simultaneamente com pesquisa de configuração da interação. Ou seja, a conformação do ligando é pesquisada em simultâneo com a pesquisa da interação (varia-se a posição do ligando, assim como a conformação do mesmo).
Docking de fragmentos do ligando. Descreve este processamento do ligando.
Docking de fragmentos do ligando
→ Ligando cortado em fragmentos. Ou seja, faz-se o docking individual do fragmento ao sítio ativo onde se ligam melhor.
→ Os vários fragmentos são atracados individualmente e depois reconectados;
→ Ou inicia-se com a atracagem de um fragmento (ex: fragmento maior) e reconstrói-se o ligando a partir do primeiro fragmento.
Quais são as duas estratégias de pesquisa da geometria e configuração da interação em docking?
Complementaridade das formas e Cálculos de energia.
Descreve a complementaridade das formas como uma boa estratégia de pesquisa da geometria e configuração da interação (searching).
Procura do melhor alinhamento possível entre o ligando e os requisitos do recetor (geometria e propriedades que tenham de obececer o ligando para interatuar com o recetor como doador/aceitador de ponto de H, centro de interação hidrofóbica) e vê-se se é capaz de concretizar a interação e atividade esperada. Ou seja, faz uso da complementaridade das formas.
→ Por exemplo: todos os triângulos de átomos apropriados no ligando são exaustivamente mapeados nos triângulos de pontos de interação do recetor (com geometria e química apropriados).
Quais os três métodos para cálculos de energia como estratégia de pesquisa da geometria e configuração da interação?
Métodos de Monte Carlo, métodos de Dinâmica Molecular e Algoritmos genéticos
Descreve o método de Monte Carlo como um método de cálculo de energia como estratégia de pesquisa da geometria e configuração da interação.
◦ Métodos Monte Carlo (aleatoriedade). Experimentam poses aleatórias, calculam-se energias para cada uma e selecionam-se as poses com a energia mais favorável descartando e aceitando valores ao longo do estudo.
→ Procura aleatória. Variações aleatórias ao longo dos graus de liberdade translacional, rotacional e conformacional.
→ Se a nova configuração tiver menor energia que a anterior, é aceite
→ Se não tiver, a probabilidade de ser aceite é dada por:
𝑷=𝐞𝐱𝐩 [−(𝑬𝒏𝒐𝒗𝒂−𝑬𝒂𝒏𝒕𝒆𝒓𝒊𝒐𝒓)/𝒌𝑻] : K = constante de Boltzmann
T = temperatura (vai diminuindo à medida que passa o tempo-simula a cristalização) Para Talta são permitidos vários movimentos; Para Tbaixa, considera-se a molécula cristalizada, sem capacidade de mudança de conformação.
Descreve o método de dinâmica molecular como um método de cálculo de energia como estratégia de pesquisa da geometria e configuração da interação.
Métodos de dinâmica molecular
→ Simulação “realista” do docking – os ligandos sujeitam-se às formas das moléculas a volta que alteram a posição e conformação
→ Grandes experiências computacionais.
Descreve os algoritmos como um método de cálculo de energia como estratégia de pesquisa da geometria e configuração da interação.
Algoritmos genéticos
→ Simulam a evolução natural de uma população.
→ É a estratégia que o Autodock utiliza
→ Um individuo corresponde a uma posição do ligando relativamente ao recetor (e sua conformação)
→ Os genes codificam as variáveis de translação e rotação do ligando relativamente ao recetor e os seus ângulos de torsão.
→ Começa-se com a melhor população, sendo que este algoritmo avalia os indivíduos todos e faz com que sobrevivam os mais aptos (poses que tem a energia de gibbs mais baixa). Na geração seguinte são geradas poses novas que se assemelham às anteriores a partir da geração anterior, ocorrendo a alteração de genes e obtendo indivíduos mais aptos.
Critério: energia de interação e a posição do ligando relativamente ao recetor
Como é que as moléculas de água afetam o Docking?
◦ Pode haver moléculas de água entre o ligando e o recetor;
◦ As interações podem ser mediadas por moléculas de água, isto é, mediar as interações simultâneas das moléculas de água com o recetor e/ou ligando;
◦ Experimentar incluir e excluir moléculas de água durante docking é complicado;
◦ Habitualmente colocam-se moléculas de águas ligadas ao recetor (como se fizessem parte dele) no início, caso haja informação de cristalografia de raios X (CRX) ou previsão computacional acerca de moléculas de água no local de ligação.
◦ Outra opção é desprezar por completo as moléculas de água, quando os métodos tiverem sido parametrizados a partir das estruturas sem moléculas de água.
Quando lidamos com água em docking o que deve ter em conta a função de scoring?
Deve ter em conta os parâmetros de:
◦ Energia de interação (pKd)
◦ Eletrostática – atração e repulsão entre cargas
◦ Interações de van der walls
◦ Ligações de hidrogénio (interaçoes decisivas)
◦ Efeitos de solvatação (solvente favorece ou não uma det orientação do ligando)
◦ Perda de entropia
◦ Centros ativos de águas
O que é que métodos force-field têm em conta?
Ligações (como se fossem molas),
Ângulos entre átomos,
Torções,
Interações não ligadas (como repulsão de van der Waals e atração eletrostática).
Uso do AMBER em scoring de docking. Descreve-o
AMBER = Assisted Model Building with Energy Refinement.
Obtém-se um termo de duplo somatório, utilizado para calcular termos para pares de átomos (energias de interação entre cargas/repulsões entre pares de átomos), do ligando e recetor, através dos choques a ocuparem a mesma zona/posições.
Funções empíricas em scoring de Docking…
(energia de interação pode ser decomposta numa soma de termos correspondentes a interações locais, intuitivas), recorrendo à expressão:
𝚫𝑮𝒍𝒊𝒈𝒂çã𝒐≈Σ𝚫𝐆𝐢𝒇𝒊
O peso que cada um destes termos tem é afinado (por uma regressão) de acordo com conjuntos de dados experimentais – o 𝚫𝑮𝒍𝒊𝒈𝒂çã𝒐 é uma soma de contributos, sendo cada um destes de um aspeto da estrutura molecular.
Como é que o autodock faz scoring de Docking?
No AutoDock, recorre-se à seguinte contribuição, similar ao ciclo termodinâmico de Wesson e Eisenberg. A função apresenta 5 termos, onde os Δ𝐺 são coeficientes empiricamente determinados através de regressões lineares com constantes de interação conhecidas.
O AutoDock calcula o ΔG somando vários efeitos físicos: Van der Waals + pontes de hidrogênio + cargas elétricas + flexibilidade do ligante + interação com o solvente.
Docking – principais limitações atuais:
◦ Colocação de moléculas de água;
◦ Determinação dos estados de protonação (pKa), tanto do ligando como da macromolécula.
→ Por exemplo: um ligando com grupos enolisáveis (COOH) esta característica vai ser decisiva para as interaçoes que vao ocorrer: no estado protonado pode doar um H para pontes de H; se tiver desprotonado não tem H para doar e já não podia formar essa interação, podendo, desta vez. receber H ou mesmo interações iónicas.
◦ Flexibilidade do recetor: maus resultados da experiência de docking podem ser devidos à flexibilidade da molécula.
→ Por exemplo: não é possível simular os ajustes de flexibilidade do sítio ativo ao ligando, caso trabalhemos com simuladores que desprezam este fator, afastando-se do resultado.
◦ Qualidade e diversidade dos dados experimentais para a construção de funções empíricas.