Реализуйте сокращение URL


12

URL становятся слишком длинными. Итак, вы должны реализовать алгоритм для сокращения URL.

я. Структура URL

URL состоит из 2 основных частей: домена и пути . Домен - это часть URL до первого слеша. Вы можете предположить, что URL не включает протокол. Путь это все остальное.

II. Домен

Домен URL будет что - то вроде: xkcd.com meta.codegolf.stackexcchhannnge.cooom. Каждая часть разделена периодом, например blag.xkcd.com, в частях это «blag», «xkcd» и «com». Вот что вы будете делать с этим:

  • Если он содержит более двух частей, отложите последние две части в сторону и объедините первую букву остальных частей.

  • Затем соедините это с первым письмом до второй части.

  • Добавьте точку, а также вторую и третью букву от второй до последней части.

  • Откажитесь от последней части.

III. Тропинка

Путь будет так: /questions/2140/ /1407/. Как и прежде, «части» разделяются косыми чертами. Для каждой части пути выполните:

  • Добавить косую черту

  • Если он полностью состоит из десятизначных цифр, интерпретируйте его как число и преобразуйте в целое число-36.

  • В противном случае добавьте первую букву детали.

В конце добавьте косую черту.

внутривенно Разный

  • Это , поэтому выигрывает самый короткий код.
  • Путь может быть пустым, но URL всегда будет заканчиваться косой чертой.
  • Там не будет протокола (например http://, file:///)
  • В домене никогда не будет меньше двух частей.
  • Применяются стандартные лазейки.

Примеры

In: xkcd.com/72/
Out:x.kc/20/

In: math.stackexchange.com/a/2231/
Out:ms.ta/a/1pz/

In: hello.org/somecoolcodeintrepreteriijjkk?code=3g3fzsdg32,g2/
Out:h.el/s/


В вашем последнем примере, путь не заканчивается на kkи все, что начинается с, ?является строкой запроса, которая не должна заканчиваться косой чертой? Также не все URL будут заканчиваться косой чертой /, как www.something.com/path. Или это не имеет отношения к цели этого вызова?
insertusername здесь

Это не имеет значения.
ev3commander

Ответы:


0

Pyth, 93 85 байт

Lsm@+jkUTGdjb36J<zxz\/KP>zhxz\/=cJ\.pss[mhd<J_2hePJ\.<tePJ2\/;=cK\/sm+?-djkUThdysd\/K

Собранный вручную в псевдокод Python:

                z = input()                     # raw, unevaluated
                G = "abcdefghijklmnopqrstuvwxyz"
                k = ""
                T = 10
L               def y(b):                       # define y as base10to36
 sm                 join(map(lambda d:
  @+jkUTGd            (join(range(T),interleave=k)+G)[d],
                                                # the join(..)+G makes "0...9a...z"
  jb36                 convert(b,36)            # returns a list of digit values in base10
J<zxz\/         J = z[:z.index("\/")]           # domain portion
KP>zhxz\/       K = z[1+z.index("\/"):][:-1]    # path portion
=cJ\.           J = J.split(".")                # splits domain into parts
pss[            no_newline_print(join(join[     # 1 join yields a list, the other a string
 mhd<J_2            map(lambda d:d[0],J[:-2]),
 hePJ               J[:-1][-1][1],
 \.                 ".",
 <tePJ2             J[:-1][-1][1:][:2],
 \/                 "\/"
;               ])
=cK\/           K = K.split("\/")
sm              print(join(map(lambda d:
 +?-djkUThdysd\/    "\/"+(d[0] if filterOut(d,join(range(T),interleave=k)) else y(int(d))),
                    # the filter will turn pure number into empty string, which is False
 K                  K)))

Наконец мучение заканчивается ...


4

JavaScript (ES6), 149 байт

u=>u.split`/`.map((p,i)=>i?/^\d+$/.test(p)?(+p).toString(36):p[0]:(d=p.split`.`).slice(0,-1).map((s,j)=>s[l=j,0]).join``+"."+d[l].slice(1,3)).join`/`

объяснение

Я сделал это независимым от решения @ Neil, но в итоге оно выглядело очень похожим.

u=>
  u.split`/`.map((p,i)=>       // for each part p at index i
    i?                         // if this is not the first part
      /^\d+$/.test(p)?         // if p is only digits
        (+p).toString(36)      // return p as a base-36 number
      :p[0]                    // else return the first letter
    :
      (d=p.split`.`)           // d = domain parts
      .slice(0,-1).map((s,j)=> // for each domain part before the last
        s[l=j,0]               // return the first letter, l = index of last domain part
      ).join``
      +"."+d[l].slice(1,3)     // add the 2 letters as the final domain
  )
  .join`/`                     // output each new part separated by a slash

Тестовое задание


1

JavaScript ES6, 157 байт

u=>u.split`/`.map((p,i)=>i?/^\d+$/.test(p)?(+p).toString(36):p[0]:p.split`.`.reverse().map((h,i)=>i--?i?h[0]:h[0]+'.'+h[1]+h[2]:'').reverse().join``).join`/`

Изменить: Сохранено 4 байта благодаря Doᴡɴɢᴏᴀᴛ.


Вы должны быть в состоянии сделать .split('/')и .split('.')в строковые шаблоны
Downgoat

@ Doᴡɴɢᴏᴀᴛ Ба, я тоже вспомнил join!
Нил

1

Python 2, 378 365 байт

Обновить

Гольф немного вниз. ~ 150 байт для функции base36 раздражают, но я не могу избавиться от них, пока в python нет встроенной функции для этого ...

def b(n):
 a=abs(n);r=[];
 while a :
    r.append('0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'[a%36]);a//=36
 if n<0:r.append('-')
 return''.join(reversed(r or'0'))
u=raw_input();P=u.split("/")[0].split(".")
print"".join([p[0] for p in P[0:-2]]+[P[-2][0]]+["."]+list(P[-2])[1:3]+["/"]+[b(int(p))+"/"if p.isdigit()else p[0]+"/" for p in u.split(".")[-1].split("/")[1:-1]])

Старая версия

def b(n):
 a=abs(n)
 r=[]
 while a:
    r.append('0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ'[a%36])
    a//=36
 if n<0:r.append('-')
 return''.join(reversed(r or'0'))
u=raw_input()
P=u.split("/")[0].split(".")
s=""
if len(P)>2:
 for p in P[:-2]:s+=p[0]
s+=P[-2][0]+"."+P[0][1:3]
P=u.split(".")[-1].split("/")[1:-1]
for p in P:
 s+="/"+(b(int(p)) if p.isdigit() else p[0])
print s+"/"

Поскольку в Python нет встроенного способа конвертировать целые числа в base36-String, я взял реализацию от numpy и проиграл ее. Отдых довольно прост, я буду играть в гольф больше после работы. Предложения всегда приветствуются!


0

Pyhton 2, 336 329 байт

Обновить

исправлено и сокращено благодаря webwarrior

def b(a):
 r=''
 while a:
  r+=chr((range(48,58)+range(65,91))[a%36])
  a//=36
 return ''.join(reversed(r or '0'))
u=raw_input()
P=u.split('/')[0].split('.')
s=''
if len(P)>2:
 for p in P[:-2]: s+=p[0]
s+=P[-2][0]+'.'+P[0][1:3]
P=u.split('.')[-1].split('/')[1:]
for p in P: s+='/'+(b(int(p)) if p.isdigit() else p[0])
print s+'/'

оригинал

Версия DenkerAffe с некоторыми модами: правильно обрабатывать схему "foo / bar? Baz", плюс, нет необходимости в отрицательном регистре в функции преобразования base36.

 def b(a):
 r=''
 while a:
  r+=('0123456789ABCDEFGHUKLMNOPQRSTUVWXYZ'[a%36])
  a//=36
 return ''.join(reversed(r or '0'))
u=raw_input()
P=u.split('/')[0].split('.')
s=''
if len(P)>2:
 for p in P[:-2]: s+=p[0]
s+=P[-2][0]+'.'+P[0][1:3]
P=u.split('.')[-1].split('/')[1:]
for p in P: s+='/'+(b(int(p)) if p.isdigit() else p[0])
print s+'/'

В вашей строке поиска есть ошибка, а также вся строка может быть короче:r+=chr((range(48,58)+range(65,91))[a%36])
webwarrior
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.