Calificaciones del editor: Calificaciones de los usuarios: [Total: 0 Promedio: 0].ilfs_responsive_below_title_1 { ancho: 300px; } @media (ancho mínimo: 500 px) {.ilfs_responsive_below_title_1 { ancho: 300 px; } } @media (ancho mínimo: 800 px) {.ilfs_responsive_below_title_1 { ancho: 336 px; } }
Data Diff es una herramienta gratuita de línea de comandos de código abierto para comparar tablas de diferentes bases de datos. Se conecta a bases de datos SQL como MySQL, Postgres, BigQuery, Snowflake y puede generar un resultado de diferencia cuando le asigna un nombre de tabla para comparar. Junto con el nombre de la tabla, toma un nombre de columna como parámetro de comparación y luego genera el resultado.
Esta herramienta está disponible como un servicio en línea y puede usarla, pero tiene limitaciones. Pero la herramienta de línea de comandos es gratuita y de código abierto e incluso puede usarla en producción. Las tablas de bases de datos que tienen millones de filas se pueden comparar con él y puede procesarlas todas con facilidad.
El resultado de diferencia que produce se puede almacenar en un archivo en caso de que desee guardarlo. Con esto, puede descubrir la duplicación de datos y las discrepancias en las mismas tablas de la base de datos en diferentes DBMS. Hay un comando muy simple que debe ejecutar para usarlo, que mencionaré en la siguiente sección.
Herramienta gratuita para comparar tablas en MySQL, Postgres, bases de datos: diferencia de datos
Entonces, asegúrese de tener los comandos python y pip disponibles en la terminal. Ejecute el siguiente comando para instalarlo.
pip install data-diff
También necesita controladores de base de datos para comunicarse con las bases de datos. Debe instalar los controladores por separado para cada sistema de base de datos con el que vaya a compararlo. En mi caso, solo quiero comparar una tabla entre Postgres y MySQL, así que emitiré estos comandos. Pero verifique los otros comandos en su GitHub README.
pip install”data-diff[mysql]”pip install”data-diff[postgres]”
Ahora, todo está listo para usar. Ejecútelo en la sintaxis especificada a continuación y luego presione enter. Para obtener la cadena de conexión de la base de datos, puede seguir esta página de documentación.
data-diff DB_Connection1 TABLE1_NAME DB_Connection2 TABLE2_NAME [OPCIONES]
Finalmente, ejecute el comando y luego generará el resultado diff. Puede comparar dos tablas cualesquiera de cualquier base de datos a la que tenga acceso. Los procesará todos con facilidad y luego le mostrará los resultados finales.
De esta manera, puede usar esta sencilla y potente herramienta de línea de comandos para comparar tablas de una base de datos. Simplemente déle cadenas de conexión junto con el nombre de la tabla y se encargará del resto. Si es programador, puede crear una GUI basada en esto y usarla en el trabajo.
Reflexiones finales:
Hay muy pocas herramientas gratuitas de comparación de bases de datos que se puedan usar en producción. Y Data Diff es uno de ellos. Me gustó cómo funciona y ofrece muchas opciones para formatear los resultados finales. Si es administrador o ingeniero de bases de datos, definitivamente lo encontrará útil.