A análise estatística primária foi realizada com base na intenção de tratar, com todos os participantes sendo analisados de acordo com o grupo de tratamento alocado, independentemente do tratamento que realmente receberam. O teste exato de Fisher e o teste do χ2 foram utilizados para comparar as taxas de diarreia, bem como as taxas de DAA e ICD entre variáveis categóricas. Riscos relativos com intervalos de confiança de 95% foram utilizados para descrever os efeitos do tratamento com LcS. Uma série de análises univariadas de triagem foi realizada. Regressões logísticas foram utilizadas para estabelecer quais fatores influenciaram individualmente a ocorrência de diarreia e sua duração, bem como o desenvolvimento de ICD no acompanhamento em Abx + 7d e Abx + 30d.
A regressão linear foi utilizada para medidas de resultados contínuos para a duração e o número de episódios de diarreia. Posteriormente, foram utilizados preditores univariados estatisticamente significativos, regressão logística binária múltipla e análise de regressão múltipla para determinar preditores estatisticamente significativos para DAA, ICD e outros desfechos secundários, após contabilizar sua relação com outras variáveis pertinentes. Nenhuma provisão para multiplicidade foi feita para os resultados secundários.
Para reduzir o viés implícito na utilização apenas de casos completos foram utilizados procedimentos de imputação múltipla para os dados usando a função de imputação múltipla SPSS (SPSS versão 25, Inc, Chicago, IL) com especificação totalmente condicional (iterações máximas de 500) usando um modelo de Método da Média Preditiva (PMM) para produzir 10 conjuntos de dados imputados. O modelo de imputação incluiu todas as variáveis (demográficas, clínicas e desfechos) envolvidas nas análises, com limites de variáveis imputadas pelo PMM definidos para que os valores imputados estivessem dentro da faixa de dados disponíveis. As principais variáveis de resultado, ou seja, DAA e ICD, não foram imputadas.
Esses 10 conjuntos de dados imputados foram analisados individualmente como normais. Posteriormente, foram usados procedimentos padrão de imputação múltipla para combinar as quantidades de estimativas escalares múltiplas e multivariadas, o que reduz o viés de análise de conjuntos de dados incompletos. Para regressão logística são relatados odds ratio (OR), Nagelkerke (R) e casos corretamente classificados. Para regressão linear são reportados os coeficientes R2 e β ajustados com significância do teste t. Para todos os testes, um valor de p igual ou inferior a 0,05 ou quando o IC de 95% para OU não ultrapassou 1,0 foi considerado estatisticamente significativo. A análise estatística foi realizada com o software Minitab (versão 25.0; Minitab, Inc.) e SPSS (versão 19; IBM Corporations).