Esto está muy bueno! Al desarrollar ciertos software clínicos, es invaluable contar con datasets verosímiles para probarlos.
A una escala más pequeña, yo escribí un script que genera “identidades” para alimentar y probar sistemas; genera listados de nombres completos (tomados de bases de datos con nombres y apellidos que uno puede suministrarle al script), junto con RUTs válidos que pueden estar entre rangos especificados, si se desea que sean RUTs que validen pero que no estén en uso real. Incluso genera fechas de nacimiento que son más o menos acordes al RUT correspondiente