Нахождение пути текущего исполняемого файла без / proc / self / exe


190

Мне кажется, что в Linux легко с / proc / self / exe. Но я хотел бы знать, есть ли удобный способ найти каталог текущего приложения в C / C ++ с кросс-платформенными интерфейсами. Я видел, как некоторые проекты возились с argv [0], но это не совсем надежно.

Если бы вам когда-нибудь приходилось поддерживать, скажем, Mac OS X, у которой нет / proc /, что бы вы сделали? Используйте #ifdefs для изоляции кода, специфичного для платформы (например, NSBundle)? Или попробуйте вывести путь к исполняемому файлу из argv [0], $ PATH и прочего, рискуя найти ошибки в крайних случаях?



Я погуглил: возьми меня ps -o comm. Что привело меня сюда: "/proc/pid/path/a.out"
таз

Ответ IMHO prideout заслуживает того, чтобы быть на вершине, потому что он правильно отвечает требованию «кроссплатформенных интерфейсов» и очень прост в интеграции.
Стефан Гурихон

Ответы:


348

Некоторые специфичные для ОС интерфейсы:

Портативный (но менее надежный) метод заключается в использовании argv[0]. Хотя вызывающая программа может установить для него что угодно, по соглашению это может быть либо путь к исполняемому файлу, либо имя, которое было найдено с помощью $PATH.

В некоторых оболочках, включая bash и ksh, переменная среды " _" задает полный путь к исполняемому файлу до его выполнения. В этом случае вы можете использовать, getenv("_")чтобы получить его. Однако это ненадежно, потому что не все оболочки делают это, и его можно установить на что-либо или оставить в родительском процессе, который не изменил его до выполнения вашей программы.


3
Также обратите внимание, что _NSGetExecutablePath () не следует по символическим ссылкам.
Нарусь

1
NetBSD: ссылка для чтения / proc / curproc / exe DragonFly BSD: ссылка для чтения / proc / curproc / file
naruse

6
Solaris: char exepath[MAXPATHLEN]; sprintf(exepath, "/proc/%d/path/a.out", getpid()); readlink(exepath, exepath, sizeof(exepath));; это отличается от getexecname()- что делает эквивалент pargs -x <PID> | grep AT_SUN_EXECNAME...
FrankH.

4
«QDesktopServices :: storageLocation (QDesktopServices :: DataLocation)» Это не путь к исполняемому файлу, а путь к пользовательскому каталогу, в котором должны храниться данные.

2
OpenBSD - единственный, где вы все еще не можете в 2017 году. Вы должны использовать путь PATH и argv [0]
Lothar

27

Использование /proc/self/exeне переносимо и ненадежно. В моей системе Ubuntu 12.04 вы должны быть пользователем root, чтобы читать / следовать символической ссылке. Это сделает пример Boost и, возможно, опубликованные whereami()решения потерпят неудачу.

Этот пост очень длинный, но в нем обсуждаются актуальные проблемы и представлен код, который фактически работает вместе с проверкой на соответствие тестовому набору.

Лучший способ найти вашу программу - повторить те же шаги, которые использует система. Это делается с помощью argv[0]разрешения файловой системы root, pwd, пути и с учетом символических ссылок и канонизации пути. Это по памяти, но я успешно делал это в прошлом и проверил в различных ситуациях. Он не гарантированно работает, но если этого не произойдет, у вас, вероятно, возникнут гораздо большие проблемы, и он в целом более надежен, чем любой из других обсуждаемых методов. В Unix-совместимой системе существуют ситуации, в которых правильная обработкаargv[0]не получит вас к вашей программе, но тогда вы выполняете в явно нарушенной среде. Он также достаточно переносим для всех производных систем Unix с 1970 года и даже для некоторых не производных от Unix систем, поскольку в основном он использует стандартные функции libc () и стандартные функции командной строки. Он должен работать на Linux (все версии), Android, Chrome OS, Minix, оригинальной версии Bell Labs Unix, FreeBSD, NetBSD, OpenBSD, BSD xx, SunOS, Solaris, SYSV, HPUX, Concentrix, SCO, Darwin, AIX, OS X, Nextstep и т. Д. И с небольшой модификацией, вероятно, VMS, VM / CMS, DOS / Windows, ReactOS, OS / 2 и т. Д. Если программа была запущена непосредственно из среды графического интерфейса, она должна указывать argv[0]абсолютный путь.

Поймите, что почти каждая оболочка в каждой Unix-совместимой операционной системе, которая когда-либо выпускалась, в основном находит программы одинаково и настраивает операционную среду почти одинаково (с некоторыми дополнительными дополнениями). Ожидается, что любая другая программа, которая запускает программу, создаст ту же среду (argv, строки окружения и т. Д.) Для этой программы, как если бы она запускалась из оболочки, с некоторыми дополнительными дополнениями. Программа или пользователь могут настроить среду, которая отличается от этого соглашения для других подчиненных программ, которые он запускает, но если это так, то это ошибка, и у программы нет разумных ожиданий, что подчиненная программа или ее подчиненные будут работать правильно.

Возможные значения argv[0]включают в себя:

  • /path/to/executable - абсолютный путь
  • ../bin/executable - относительно pwd
  • bin/executable - относительно pwd
  • ./foo - относительно pwd
  • executable - имя базы, найти в пути
  • bin//executable - относительно pwd, неканонический
  • src/../bin/executable - относительно pwd, неканонический, возвращение
  • bin/./echoargc - относительно pwd, неканонический

Значения, которые вы не должны видеть:

  • ~/bin/executable Переписать до запуска вашей программы.
  • ~user/bin/executable - переписан до запуска вашей программы
  • alias - переписан до запуска вашей программы
  • $shellvariable - переписан до запуска вашей программы
  • *foo* - подстановочный знак, переписанный до запуска вашей программы, не очень полезный
  • ?foo? - подстановочный знак, переписанный до запуска вашей программы, не очень полезный

Кроме того, они могут содержать неканонические имена путей и несколько слоев символических ссылок. В некоторых случаях может быть несколько жестких ссылок на одну и ту же программу. Например, /bin/ls, /bin/ps, /bin/chmod, /bin/rmи т.д. , могут быть жесткие ссылки /bin/busybox.

Чтобы найти себя, выполните следующие действия:

  • Сохраните pwd, PATH и argv [0] при входе в вашу программу (или при инициализации вашей библиотеки), так как они могут измениться позже.

  • Необязательно: особенно для не-Unix систем, выделите, но не отбрасывайте часть префикса hostname / user / drive, если она есть; часть, которая часто предшествует двоеточию или следует после начального "//".

  • Если argv[0]это абсолютный путь, используйте его в качестве отправной точки. Абсолютный путь, вероятно, начинается с «/», но в некоторых не-Unix системах он может начинаться с «\», либо с буквы диска или префикса имени, за которым следует двоеточие.

  • Иначе, если argv[0]это относительный путь (содержит "/" или "\", но не начинается с него, например, "../../bin/foo", затем объедините pwd + "/" + argv [0] (используйте текущая рабочая директория с момента запуска программы, а не текущая).

  • Иначе, если argv [0] - простое базовое имя (без косых черт), затем по очереди объедините его с каждой записью в переменной окружения PATH, попробуйте их и используйте первое, которое завершится успешно.

  • Дополнительно: Else попробовать самой конкретной платформы /proc/self/exe, /proc/curproc/file(BSD), и (char *)getauxval(AT_EXECFN), и dlgetname(...)если они присутствуют. Вы могли бы даже попробовать эти ранее argv[0]основанные методы, если они доступны, и у вас нет проблем с разрешениями. В некотором маловероятном случае (когда вы рассматриваете все версии всех систем), что они присутствуют и не выходят из строя, они могут быть более авторитетными.

  • Необязательно: проверьте имя пути, переданное с помощью параметра командной строки.

  • Необязательно: проверьте путь в среде, явно переданной вашим сценарием-оболочкой, если таковой имеется.

  • Необязательно: В крайнем случае попробуйте переменную среды "_". Это может указывать на другую программу целиком, например на оболочку пользователя.

  • Разрешить символические ссылки, может быть несколько слоев. Существует возможность бесконечных циклов, хотя, если они существуют, ваша программа, вероятно, не будет запущена.

  • Канонизируйте имя файла, разрешив подстроки типа "/foo/../bar/" в "/ bar /". Обратите внимание, что это может потенциально изменить значение, если вы пересекаете точку монтирования сети, поэтому канонизация не всегда хорошая вещь. На сетевом сервере символ «..» в символьной ссылке может использоваться для прохождения пути к другому файлу в контексте сервера, а не на клиенте. В этом случае вам, вероятно, нужен клиентский контекст, поэтому канонизация в порядке. Также конвертируйте шаблоны типа "/./" в "/" и "//" в "/". В оболочке, readlink --canonicalizeразрешит несколько символических ссылок и канонизирует имя. Чейз может сделать подобное, но не установлен. realpath()или canonicalize_file_name(), если присутствует, может помочь.

Если realpath()во время компиляции не существует, вы можете позаимствовать копию из разрешительно лицензированного дистрибутива библиотеки и скомпилировать ее самостоятельно, а не изобретать велосипед. Исправьте потенциальное переполнение буфера (укажите размер выходного буфера, подумайте, что strncpy () vs strcpy ()), если вы будете использовать буфер меньше, чем PATH_MAX. Возможно, будет проще использовать переименованную личную копию, чем тестировать, если она существует. Разрешительная копия лицензии с android / darwin / bsd: https://android.googlesource.com/platform/bionic/+/f077784/libc/upstream-freebsd/lib/libc/stdlib/realpath.c

Помните, что несколько попыток могут быть успешными или частично успешными, и не все они могут указывать на один и тот же исполняемый файл, поэтому рассмотрите возможность проверки вашего исполняемого файла; однако у вас может не быть разрешения на чтение - если вы не можете его прочитать, не рассматривайте это как сбой. Или проверьте что-нибудь рядом с вашим исполняемым файлом, например, каталог "../lib/", который вы пытаетесь найти. У вас может быть несколько версий, упакованных и локально скомпилированных версий, локальных и сетевых версий, а также портативных версий локальных и USB-накопителей и т. Д., И существует небольшая вероятность того, что вы можете получить два несовместимых результата из разных методов определения местоположения. И «_» может просто указывать на неправильную программу.

Программа, использующая программу, execveможет быть намеренно установлена argv[0]как несовместимая с фактическим путем, используемым для загрузки программы и повреждения PATH, «_», pwd и т. Д., Хотя, как правило, нет особых причин для этого; но это может иметь последствия для безопасности, если у вас есть уязвимый код, который игнорирует тот факт, что среда выполнения может быть изменена различными способами, включая, но не ограничиваясь этим, (chroot, файловая система fuse, жесткие ссылки и т. д.). Возможно для команд оболочки, чтобы установить PATH, но не удается его экспортировать.

Вам не обязательно кодировать для не-Unix систем, но было бы неплохо знать о некоторых особенностях, чтобы вы могли написать код таким образом, чтобы потом было не так сложно его портировать , Помните, что некоторые системы (DEC VMS, DOS, URL-адреса и т. Д.) Могут иметь имена дисков или другие префиксы, которые заканчиваются двоеточием, например «C: \», «sys $ drive: [foo] bar» и «file» : /// Foo / бар / Баз». Старые системы DEC VMS используют «[» и «]» для включения части пути в каталог, хотя это может измениться, если ваша программа скомпилирована в среде POSIX. Некоторые системы, такие как VMS, могут иметь версию файла (разделенную точкой с запятой в конце). В некоторых системах используются две последовательные косые черты, такие как «// диск / путь / к / файлу» или «пользователь @ хост: / путь / к / файлу» (команда scp) или «файл: (разделенные пробелами) и "PATH", разделенные двоеточиями, но ваша программа должна получать PATH, поэтому вам не нужно беспокоиться о пути. DOS и некоторые другие системы могут иметь относительные пути, начинающиеся с префикса диска. C: foo.exe относится к foo.exe в текущем каталоге на диске C, поэтому вам нужно найти текущий каталог на C: и использовать его для pwd. (разделенные пробелами) и "PATH", разделенные двоеточиями, но ваша программа должна получать PATH, поэтому вам не нужно беспокоиться о пути. DOS и некоторые другие системы могут иметь относительные пути, начинающиеся с префикса диска. C: foo.exe относится к foo.exe в текущем каталоге на диске C, поэтому вам нужно найти текущий каталог на C: и использовать его для pwd.

Пример символических ссылок и оболочек в моей системе:

/usr/bin/google-chrome is symlink to
/etc/alternatives/google-chrome  which is symlink to
/usr/bin/google-chrome-stable which is symlink to
/opt/google/chrome/google-chrome which is a bash script which runs
/opt/google/chome/chrome

Обратите внимание, что пользовательский счет разместил ссылку выше на программу в HP, которая обрабатывает три основных случая argv[0]. Это требует некоторых изменений, хотя:

  • Надо будет все переписать strcat()и strcpy()использовать strncat()и strncpy(). Даже если переменные объявлены с длиной PATHMAX, входное значение длины PATHMAX-1 плюс длина объединенных строк будет> PATHMAX, а входное значение длины PATHMAX будет не определено.
  • Его нужно переписать как библиотечную функцию, а не просто распечатывать результаты.
    • Он не может канонизировать имена (используйте код реального пути, на который я ссылался выше)
    • Не удается разрешить символические ссылки (используйте код реального пути)

Таким образом, если вы комбинируете код HP и код realpath и исправляете их так, чтобы они были устойчивы к переполнению буфера, то у вас должно быть что-то, что можно правильно интерпретировать argv[0].

Ниже показаны действительные значения argv[0]для различных способов вызова одной и той же программы в Ubuntu 12.04. И да, программа была случайно названа echoargc вместо echoargv. Это было сделано с использованием сценария для чистого копирования, но выполнение этого вручную в оболочке дает те же результаты (за исключением того, что псевдонимы не работают в сценарии, если вы явно не включили их).

cat ~/src/echoargc.c
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
main(int argc, char **argv)
{
  printf("  argv[0]=\"%s\"\n", argv[0]);
  sleep(1);  /* in case run from desktop */
}
tcc -o ~/bin/echoargc ~/src/echoargc.c 
cd ~
/home/whitis/bin/echoargc
  argv[0]="/home/whitis/bin/echoargc"
echoargc
  argv[0]="echoargc"
bin/echoargc
  argv[0]="bin/echoargc"
bin//echoargc
  argv[0]="bin//echoargc"
bin/./echoargc
  argv[0]="bin/./echoargc"
src/../bin/echoargc
  argv[0]="src/../bin/echoargc"
cd ~/bin
*echo*
  argv[0]="echoargc"
e?hoargc
  argv[0]="echoargc"
./echoargc
  argv[0]="./echoargc"
cd ~/src
../bin/echoargc
  argv[0]="../bin/echoargc"
cd ~/junk
~/bin/echoargc
  argv[0]="/home/whitis/bin/echoargc"
~whitis/bin/echoargc
  argv[0]="/home/whitis/bin/echoargc"
alias echoit=~/bin/echoargc
echoit
  argv[0]="/home/whitis/bin/echoargc"
echoarg=~/bin/echoargc
$echoarg
  argv[0]="/home/whitis/bin/echoargc"
ln -s ~/bin/echoargc junk1
./junk1
  argv[0]="./junk1"
ln -s /home/whitis/bin/echoargc junk2
./junk2
  argv[0]="./junk2"
ln -s junk1 junk3
./junk3
  argv[0]="./junk3"


gnome-desktop-item-edit --create-new ~/Desktop
# interactive, create desktop link, then click on it
  argv[0]="/home/whitis/bin/echoargc"
# interactive, right click on gnome application menu, pick edit menus
# add menu item for echoargc, then run it from gnome menu
 argv[0]="/home/whitis/bin/echoargc"

 cat ./testargcscript 2>&1 | sed -e 's/^/    /g'
#!/bin/bash
# echoargc is in ~/bin/echoargc
# bin is in path
shopt -s expand_aliases
set -v
cat ~/src/echoargc.c
tcc -o ~/bin/echoargc ~/src/echoargc.c 
cd ~
/home/whitis/bin/echoargc
echoargc
bin/echoargc
bin//echoargc
bin/./echoargc
src/../bin/echoargc
cd ~/bin
*echo*
e?hoargc
./echoargc
cd ~/src
../bin/echoargc
cd ~/junk
~/bin/echoargc
~whitis/bin/echoargc
alias echoit=~/bin/echoargc
echoit
echoarg=~/bin/echoargc
$echoarg
ln -s ~/bin/echoargc junk1
./junk1
ln -s /home/whitis/bin/echoargc junk2
./junk2
ln -s junk1 junk3
./junk3

Эти примеры иллюстрируют, что методы, описанные в этом посте, должны работать в широком диапазоне обстоятельств и почему необходимы некоторые из шагов.

РЕДАКТИРОВАТЬ: Теперь программа, которая печатает argv [0], была обновлена, чтобы фактически найти себя.

// Copyright 2015 by Mark Whitis.  License=MIT style
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <limits.h>
#include <assert.h>
#include <string.h>
#include <errno.h>

// "look deep into yourself, Clarice"  -- Hanibal Lector
char findyourself_save_pwd[PATH_MAX];
char findyourself_save_argv0[PATH_MAX];
char findyourself_save_path[PATH_MAX];
char findyourself_path_separator='/';
char findyourself_path_separator_as_string[2]="/";
char findyourself_path_list_separator[8]=":";  // could be ":; "
char findyourself_debug=0;

int findyourself_initialized=0;

void findyourself_init(char *argv0)
{

  getcwd(findyourself_save_pwd, sizeof(findyourself_save_pwd));

  strncpy(findyourself_save_argv0, argv0, sizeof(findyourself_save_argv0));
  findyourself_save_argv0[sizeof(findyourself_save_argv0)-1]=0;

  strncpy(findyourself_save_path, getenv("PATH"), sizeof(findyourself_save_path));
  findyourself_save_path[sizeof(findyourself_save_path)-1]=0;
  findyourself_initialized=1;
}


int find_yourself(char *result, size_t size_of_result)
{
  char newpath[PATH_MAX+256];
  char newpath2[PATH_MAX+256];

  assert(findyourself_initialized);
  result[0]=0;

  if(findyourself_save_argv0[0]==findyourself_path_separator) {
    if(findyourself_debug) printf("  absolute path\n");
     realpath(findyourself_save_argv0, newpath);
     if(findyourself_debug) printf("  newpath=\"%s\"\n", newpath);
     if(!access(newpath, F_OK)) {
        strncpy(result, newpath, size_of_result);
        result[size_of_result-1]=0;
        return(0);
     } else {
    perror("access failed 1");
      }
  } else if( strchr(findyourself_save_argv0, findyourself_path_separator )) {
    if(findyourself_debug) printf("  relative path to pwd\n");
    strncpy(newpath2, findyourself_save_pwd, sizeof(newpath2));
    newpath2[sizeof(newpath2)-1]=0;
    strncat(newpath2, findyourself_path_separator_as_string, sizeof(newpath2));
    newpath2[sizeof(newpath2)-1]=0;
    strncat(newpath2, findyourself_save_argv0, sizeof(newpath2));
    newpath2[sizeof(newpath2)-1]=0;
    realpath(newpath2, newpath);
    if(findyourself_debug) printf("  newpath=\"%s\"\n", newpath);
    if(!access(newpath, F_OK)) {
        strncpy(result, newpath, size_of_result);
        result[size_of_result-1]=0;
        return(0);
     } else {
    perror("access failed 2");
      }
  } else {
    if(findyourself_debug) printf("  searching $PATH\n");
    char *saveptr;
    char *pathitem;
    for(pathitem=strtok_r(findyourself_save_path, findyourself_path_list_separator,  &saveptr); pathitem; pathitem=strtok_r(NULL, findyourself_path_list_separator, &saveptr) ) {
       if(findyourself_debug>=2) printf("pathitem=\"%s\"\n", pathitem);
       strncpy(newpath2, pathitem, sizeof(newpath2));
       newpath2[sizeof(newpath2)-1]=0;
       strncat(newpath2, findyourself_path_separator_as_string, sizeof(newpath2));
       newpath2[sizeof(newpath2)-1]=0;
       strncat(newpath2, findyourself_save_argv0, sizeof(newpath2));
       newpath2[sizeof(newpath2)-1]=0;
       realpath(newpath2, newpath);
       if(findyourself_debug) printf("  newpath=\"%s\"\n", newpath);
      if(!access(newpath, F_OK)) {
          strncpy(result, newpath, size_of_result);
          result[size_of_result-1]=0;
          return(0);
      } 
    } // end for
    perror("access failed 3");

  } // end else
  // if we get here, we have tried all three methods on argv[0] and still haven't succeeded.   Include fallback methods here.
  return(1);
}

main(int argc, char **argv)
{
  findyourself_init(argv[0]);

  char newpath[PATH_MAX];
  printf("  argv[0]=\"%s\"\n", argv[0]);
  realpath(argv[0], newpath);
  if(strcmp(argv[0],newpath)) { printf("  realpath=\"%s\"\n", newpath); }
  find_yourself(newpath, sizeof(newpath));
  if(1 || strcmp(argv[0],newpath)) { printf("  findyourself=\"%s\"\n", newpath); }
  sleep(1);  /* in case run from desktop */
}

И вот результат, который демонстрирует, что в каждом из предыдущих тестов он действительно находился.

tcc -o ~/bin/echoargc ~/src/echoargc.c 
cd ~
/home/whitis/bin/echoargc
  argv[0]="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
echoargc
  argv[0]="echoargc"
  realpath="/home/whitis/echoargc"
  findyourself="/home/whitis/bin/echoargc"
bin/echoargc
  argv[0]="bin/echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
bin//echoargc
  argv[0]="bin//echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
bin/./echoargc
  argv[0]="bin/./echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
src/../bin/echoargc
  argv[0]="src/../bin/echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
cd ~/bin
*echo*
  argv[0]="echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
e?hoargc
  argv[0]="echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
./echoargc
  argv[0]="./echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
cd ~/src
../bin/echoargc
  argv[0]="../bin/echoargc"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
cd ~/junk
~/bin/echoargc
  argv[0]="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
~whitis/bin/echoargc
  argv[0]="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
alias echoit=~/bin/echoargc
echoit
  argv[0]="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
echoarg=~/bin/echoargc
$echoarg
  argv[0]="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
rm junk1 junk2 junk3
ln -s ~/bin/echoargc junk1
./junk1
  argv[0]="./junk1"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
ln -s /home/whitis/bin/echoargc junk2
./junk2
  argv[0]="./junk2"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"
ln -s junk1 junk3
./junk3
  argv[0]="./junk3"
  realpath="/home/whitis/bin/echoargc"
  findyourself="/home/whitis/bin/echoargc"

Описанные выше два запуска GUI также корректно находят программу.

Есть одна потенциальная ловушка. access()Функция капель разрешения , если программа Setuid перед тестированием. Если есть ситуация, когда программа может быть найдена как пользователь с повышенными правами, но не как обычный пользователь, то может быть ситуация, когда эти тесты не пройдут, хотя маловероятно, что программа действительно может быть выполнена при таких обстоятельствах. Вместо этого можно использовать euidaccess (). Возможно, однако, что он может найти недоступную программу раньше на пути, чем фактический пользователь мог.


1
Вы вложили много усилий в это - молодец. К сожалению, ни, strncpy()ни (особенно) strncat()не используется безопасно в коде. strncpy()не гарантирует нулевое прекращение; если исходная строка длиннее целевого пространства, строка не заканчивается нулем. strncat()очень сложно использовать; strncat(target, source, sizeof(target))неверно (даже если targetпустая строка для начала), если sourceона длиннее целевой. Длина - это количество символов, которое можно безопасно добавить к цели, исключая завершающий ноль, поэтому sizeof(target)-1это максимум.
Джонатан Леффлер

4
Код strncpy правильный, в отличие от метода, который вы подразумеваете, я должен использовать. Я предлагаю вам прочитать код более внимательно. Он не переполняет буферы и не оставляет их без изменений. Каждое использование strncpy () / stncat () ограничивается копированием sizeof (buffer), который действителен, и затем последний символ буфера заполняется нулем, перезаписывая последний символ буфера. Однако strncat () неправильно использует параметр size в качестве счетчика и может переполниться из-за того, что он предшествует атакам переполнения буфера.
whitis

"sudo apt-get install libbsd0 libbsd-dev", затем s / strncat / strlcat /
whitis

1
Не используйте PATH_MAX. Это перестало работать 30 лет назад, всегда используйте malloc.
Lothar

Также, если вы используете вызов инициализации. Полностью разрешите путь к exe в init, а не просто в части, а затем сделайте это позже при вызове. Никакая ленивая оценка здесь невозможна, если вы используете realpath в распознавателе. Вместе с другими ошибками просто худший код, который я видел в stackoverflow в длинном ответе.
Лотар

13

Проверьте whereami библиотеку из Грегори Pakosz (который имеет только один файл C); он позволяет вам получить полный путь к текущему исполняемому файлу на различных платформах. В настоящее время он доступен в качестве репо на github здесь .


8

Альтернатива на Linux с использованием либо /proc/self/exeили argv[0]используют информацию , передаваемый интерпретатор ELF, доступна по Glibc как таковые:

#include <stdio.h>
#include <sys/auxv.h>

int main(int argc, char **argv)
{
    printf("%s\n", (char *)getauxval(AT_EXECFN));
    return(0);
}

Обратите внимание, что getauxvalэто расширение glibc, и чтобы быть надежным, вы должны проверить, чтобы оно не возвращалось NULL(что указывает на то, что интерпретатор ELF не предоставил AT_EXECFNпараметр), но я не думаю, что это на самом деле проблема в Linux.


Мне это нравится, так как все просто и glibc включен в Gtk + в любом случае (который я использую).
Колин Кинан

4

Если бы вам когда-нибудь приходилось поддерживать, скажем, Mac OS X, у которой нет / proc /, что бы вы сделали? Используйте #ifdefs для изоляции кода, специфичного для платформы (например, NSBundle)?

Да, изоляция кода, специфичного для платформы, #ifdefsявляется обычным способом сделать это.

Другой подход заключается в том, чтобы иметь #ifdefзаголовок без очистки, содержащий объявления функций и помещать реализации в исходные файлы для конкретной платформы. Например, посмотрите, как библиотека Poco C ++ делает что-то похожее для своего класса Environment .


4

Надежная работа этой функции на разных платформах требует использования операторов #ifdef.

Приведенный ниже код находит путь к исполняемому файлу в Windows, Linux, MacOS, Solaris или FreeBSD (хотя FreeBSD не тестировалась). Он использует boost > = 1.55.0 для упрощения кода, но его достаточно легко удалить, если хотите. Просто используйте определения, такие как _MSC_VER и __linux, как того требуют операционная система и компилятор.

#include <string>
#include <boost/predef/os.h>

#if (BOOST_OS_WINDOWS)
#  include <stdlib.h>
#elif (BOOST_OS_SOLARIS)
#  include <stdlib.h>
#  include <limits.h>
#elif (BOOST_OS_LINUX)
#  include <unistd.h>
#  include <limits.h>
#elif (BOOST_OS_MACOS)
#  include <mach-o/dyld.h>
#elif (BOOST_OS_BSD_FREE)
#  include <sys/types.h>
#  include <sys/sysctl.h>
#endif

/*
 * Returns the full path to the currently running executable,
 * or an empty string in case of failure.
 */
std::string getExecutablePath() {
#if (BOOST_OS_WINDOWS)
    char *exePath;
    if (_get_pgmptr(&exePath) != 0)
        exePath = "";
#elif (BOOST_OS_SOLARIS)
    char exePath[PATH_MAX];
    if (realpath(getexecname(), exePath) == NULL)
        exePath[0] = '\0';
#elif (BOOST_OS_LINUX)
    char exePath[PATH_MAX];
    ssize_t len = ::readlink("/proc/self/exe", exePath, sizeof(exePath));
    if (len == -1 || len == sizeof(exePath))
        len = 0;
    exePath[len] = '\0';
#elif (BOOST_OS_MACOS)
    char exePath[PATH_MAX];
    uint32_t len = sizeof(exePath);
    if (_NSGetExecutablePath(exePath, &len) != 0) {
        exePath[0] = '\0'; // buffer too small (!)
    } else {
        // resolve symlinks, ., .. if possible
        char *canonicalPath = realpath(exePath, NULL);
        if (canonicalPath != NULL) {
            strncpy(exePath,canonicalPath,len);
            free(canonicalPath);
        }
    }
#elif (BOOST_OS_BSD_FREE)
    char exePath[2048];
    int mib[4];  mib[0] = CTL_KERN;  mib[1] = KERN_PROC;  mib[2] = KERN_PROC_PATHNAME;  mib[3] = -1;
    size_t len = sizeof(exePath);
    if (sysctl(mib, 4, exePath, &len, NULL, 0) != 0)
        exePath[0] = '\0';
#endif
    return std::string(exePath);
}

Вышеприведенная версия возвращает полные пути, включая имя исполняемого файла. Если вместо этого вы хотите указать путь без имени исполняемого файла #include boost/filesystem.hpp>и измените оператор return на:

return strlen(exePath)>0 ? boost::filesystem::path(exePath).remove_filename().make_preferred().string() : std::string();

@Frank, не уверен, почему ты так говоришь. Работает для меня. Я видел другой ответ, утверждающий, что вам нужен root для доступа к / proc / self / exe, но я не обнаружил этого ни в одной из систем Linux, которые я пробовал (CentOS или Mint).
января

2

В зависимости от версии QNX Neutrino , существуют разные способы найти полный путь и имя исполняемого файла, который использовался для запуска запущенного процесса. Обозначаю идентификатор процесса как <PID>. Попробуйте следующее:

  1. Если файл /proc/self/exefileсуществует, то его содержимое является запрошенной информацией.
  2. Если файл /proc/<PID>/exefileсуществует, то его содержимое является запрошенной информацией.
  3. Если файл /proc/self/asсуществует, то:
    1. open() файл.
    2. Выделяют буфер, по крайней мере, sizeof(procfs_debuginfo) + _POSIX_PATH_MAX.
    3. Дайте этот буфер в качестве входных данных для devctl(fd, DCMD_PROC_MAPDEBUG_BASE,....
    4. Приведите буфер к procfs_debuginfo* .
    5. Запрашиваемая информация находится в pathполе procfs_debuginfoструктуры. Предупреждение : по некоторым причинам, иногда QNX пропускает первую косую черту /пути к файлу. Подготовьте это, /когда это необходимо.
    6. Очистить (закрыть файл, освободить буфер и т. Д.).
  4. Попробуйте 3.выполнить процедуру с файлом /proc/<PID>/as.
  5. Попробуйте dladdr(dlsym(RTLD_DEFAULT, "main"), &dlinfo)где dlinfoэто Dl_infoструктура, dli_fnameможет содержать запрашиваемую информацию.

Надеюсь, это поможет.


1

AFAIK, нет такого способа. И есть также двусмысленность: что бы вы хотели получить в качестве ответа, если один и тот же исполняемый файл имеет несколько жестких ссылок, «указывающих» на него? (Жесткие ссылки на самом деле не «указывают», это один и тот же файл, просто в другом месте в иерархии FS.) Как только execve () успешно выполняет новый двоичный файл, вся информация о его аргументах теряется.


1
«Как только execve () успешно выполняет новый двоичный файл, вся информация о его аргументах теряется». На самом деле, аргументы argp и envp не теряются, они передаются как argv [] и как среда, а в некоторых UN * Xes аргумент pathname или что-то построенное из него передается вместе с argp и envp (OS X / iOS, Solaris) или доступны через один из механизмов, перечисленных в ответе mark4o. Но да, это просто дает вам одну из жестких ссылок, если их несколько.

1

Вы можете использовать argv [0] и проанализировать переменную окружения PATH. Посмотрите на: пример программы, которая может найти себя


7
На самом деле это ненадежно (хотя, как правило, оно будет работать с программами, запускаемыми обычными оболочками), потому что execvи kin выбирают путь к исполняемому файлу отдельно отargv
dmckee - ex-moderator kitten

9
Это неверный ответ. Он может сказать вам , где вы могли бы найти в программу с тем же именем. Но он ничего не говорит о том, где на самом деле живет исполняемый в данный момент исполняемый файл.
Ларри Гриц

0

Более портативный способ получить путь к имени исполняемого образа:

PS может дать вам путь к исполняемому файлу, если у вас есть идентификатор процесса. Также ps - это утилита POSIX, поэтому она должна быть переносимой

поэтому, если идентификатор процесса равен 249297, то эта команда дает вам только имя пути.

    ps -p 24297 -o comm --no-heading

Объяснение аргументов

-p - выбирает данный процесс

-o comm - отображает имя команды (-o cmd выбирает всю командную строку)

--no-heading - не отображать строку заголовка, только вывод.

Программа AC может запустить это через popen.


Это дает полную строку запуска с параметрами.
ETech

--no-heading не является переносимым
Good Person

1
не работает, если первый аргумент execv не является абсолютным путем.
Гроптатыр

-4

Если вы используете C, вы можете использовать функцию getwd:

int main()
{       
 char buf[4096];
 getwd(buf);
 printf(buf);
}

Это будет вывести на стандартный вывод текущий каталог исполняемого файла.


3
по крайней мере, в Windows текущий рабочий каталог не имеет особого отношения к запущенному исполняемому файлу. Например, CreateProcess может запустить .exe и полностью установить свой рабочий каталог.
Spike0xff

Ситуация такая же на всех других ОС: текущий каталог иногда совпадает с исполняемым каталогом по случайности, но может быть совершенно другим.
Ласси

-10

Путь абсолютного значения программы находится в PWD envp вашей основной функции, также есть функция в C, называемая getenv, так что это так.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.