Есть простой ответ: почему GHC такой большой?
- OCaml: 2 МБ
- Python: 15 МБ
- SBCL: 9 МБ
- OpenJRE - 26 МБ
- GHC: 113 МБ
Не интересуется евангелизацией «Почему меня не волнует размер, если Haskell - правильный инструмент»; это технический вопрос.
Есть простой ответ: почему GHC такой большой?
Не интересуется евангелизацией «Почему меня не волнует размер, если Haskell - правильный инструмент»; это технический вопрос.
Ответы:
Это немного глупо на самом деле. Каждая библиотека, которая поставляется с GHC, представлена не менее чем в 4 вариантах :
Версия GHCi - это просто статическая версия, связанная вместе в одном .o
файле. Все остальные три версии также имеют свой собственный набор интерфейсных файлов ( .hi
файлов). Профилированные версии кажутся примерно в два раза больше непрофилированных версий (что немного подозрительно, я должен выяснить, почему это так).
Помните, что GHC сам по себе является библиотекой , поэтому вы получаете 4 копии GHC. Не только это, но сам двоичный файл GHC статически связан, так что это 5 копий GHC.
Недавно мы сделали так, чтобы GHCi мог использовать статические .a
файлы. Это позволит нам избавиться от одного из этих ароматов. В более долгосрочной перспективе мы должны динамически связывать GHC, но это более серьезное изменение, потому что это повлечет за собой динамическое связывание по умолчанию - в отличие от C, с GHC вы должны заранее решить, собираетесь ли вы динамически связывать или нет. И нам нужно больше изменений (например, в Cabal и системе пакетов, прежде всего), прежде чем это станет действительно практичным.
Вероятно, мы должны сравнить яблоки с яблоками и апельсины с апельсинами. JRE - это среда выполнения, а не набор разработчика. Мы можем сравнить: исходный размер комплекта разработки, размер скомпилированного комплекта разработки и скомпилированный размер минимального времени выполнения.
Исходный пакет OpenJDK 7 составляет 82 МБ (download.java.net/openjdk/jdk7) по сравнению с исходным пакетом GHC 7, который составляет 23 МБ (haskell.org/ghc/download_ghc_7_0_1). GHC здесь не большой. Размер среды выполнения: openjdk-6-jre-headless в Ubuntu составляет 77 МБ в несжатом состоянии по сравнению с Helloworld Haskell, статически связанным с его средой выполнения, которая составляет <1 МБ. GHC здесь не большой.
Где GHC большой, это размер скомпилированного комплекта разработки:
Сам GHC занимает 270 МБ, а вместе со всеми библиотеками и утилитами - более 500 МБ. И да, это много, даже с базовыми библиотеками и инструментом построения / менеджером зависимостей. Платформа разработки Java меньше.
GHC:
$ aptitude show ghc6 | grep Size
Uncompressed Size: 388M
против OpenJDK с зависимостями:
$ aptitude show openjdk-6-jdk openjdk-6-jre openjdk-6-jre-headless ant maven2 ivy | grep Size
Uncompressed Size: 34.9M
Uncompressed Size: 905k
Uncompressed Size: 77.3M
Uncompressed Size: 1,585k
Uncompressed Size: 3,736k
Uncompressed Size: 991k
Но это все равно больше, чем 100 МБ, а не 26 МБ, как вы пишете.
Тяжелые вещи в ghc6 и ghc6-prof:
$ dpkg -L ghc6 | grep '\.a$' | xargs ls -1ks | sort -k 1 -n -r | head -3
57048 /usr/lib/ghc-6.12.1/ghc-6.12.1/libHSghc-6.12.1.a
22668 /usr/lib/ghc-6.12.1/Cabal-1.8.0.2/libHSCabal-1.8.0.2.a
21468 /usr/lib/ghc-6.12.1/base-4.2.0.0/libHSbase-4.2.0.0.a
$ dpkg -L ghc6-prof | grep '\.a$' | xargs ls -1ks | sort -k 1 -n -r | head -3
112596 /usr/lib/ghc-6.12.1/ghc-6.12.1/libHSghc-6.12.1_p.a
33536 /usr/lib/ghc-6.12.1/Cabal-1.8.0.2/libHSCabal-1.8.0.2_p.a
31724 /usr/lib/ghc-6.12.1/base-4.2.0.0/libHSbase-4.2.0.0_p.a
Обратите внимание, насколько большой libHSghc-6.12.1_p.a
. Таким образом, ответ, кажется, статические ссылки и профилирование версий для каждой библиотеки там.
Мое предположение - много-много статических ссылок. Каждая библиотека должна статически связывать свои зависимости, которые, в свою очередь, должны статически связывать свои и другие. И все это часто компилируется как с профилированием, так и без него, и даже без профилирования двоичные файлы не удаляются и поэтому содержат много информации отладчика.
Вот разбивка размера каталога на моей коробке:
https://spreadsheets.google.com/ccc?key=0AveoXImmNnZ6dDlQeHY2MmxPcEYzYkpweEtDSS1fUlE&hl=en
Похоже, самый большой каталог (123 МБ) - это двоичные файлы для компиляции самого компилятора. Документы весят в поразительных 65 МБ. Третье место - Кабал в 41 МБ.
Каталог bin составляет 33 МБ, и я думаю, что только часть из этого является технически необходимой для создания приложений на Haskell.
Короткий ответ: все исполняемые файлы статически связаны, могут содержать отладочную информацию, а библиотеки включены в несколько копий. Об этом уже говорили другие комментаторы.
Динамическое связывание возможно и значительно уменьшит размер. Вот пример Hello.hs
:
main = putStrLn "Hello world"
Я строю с GHC 7.4.2 на Windows.
ghc --make -O2
дает Hello.exe
1105Ks
Бег strip
на нем оставляет 630К
ghc --make -O2 -dynamic
дает 40К
Зачистка оставляет только 13K.
Это зависимости 5 dll с общим размером 9,2 МБ без зазоров и 5,7 МБ без зачистки.