Вы получите гораздо лучший ответ, если предоставите еще несколько технических деталей о том, какие данные вы пытаетесь поставить под контроль версий, как вы хотите хранить разные версии данных, какие компоненты могут измениться. и какие компоненты не, и действительно ли у вас будет древовидная история (ветви, слияния).
Файлы HDF5 не подходят для контроля версий на основе diff в git.
git использует внутреннюю базу данных на основе хеша, поэтому можно хранить хеш вашего файла данных HDF5 без фактического сохранения самого файла. Три проекта, git-fat , git-annex и git-media , значительно упрощают этот процесс для вас. Я бы предложил использовать этот подход, если у вас есть большие, полностью независимые порции данных, которые вы хотели бы явно версии.
Если вы сможете разделить хранилище данных на энергонезависимые и нестабильные регионы, это значительно повысит эффективность вашего взаимодействия с базой данных контроля версий. Вы также можете рассмотреть возможность явного использования базы данных для ваших данных, если вам не нужны предложения git по функциям DVCS.