MarkNest 25 апр в 10:21

пропало. Что осталось на трубе? (алгоритм получения ответа в частном случае)

3 мин

3.1K

JavaScript*Алгоритмы*Математика*GitHub*DIY или Сделай сам

Комментарии 40

pack (M, [(all(M(i) /= V), i=1,size(M))])

Чего только люди не выдумают, чтобы не писать вычисления на предписанном богом языке.

Это всё векторизуется.

А в Вашем алгоритме не учитывается случай, когда в массиве M несколько одинаковых чисел, подлежащих вычёркиванию. Если это, конечно, массив, а не множество.

MarkNest 25 апр в 11:05

Спасибо. Конечно, Вы правы. Интересно, кстати, было бы сравнить - какой алгоритм (Ваш или мой) быстрее справится с задачей, например, для n = 10^6, k = 2.

vadimr 25 апр в 11:14

Можете попробовать на своём компьютере. У меня для этих параметров выполняется за 4 миллисекунды.

program exclude

implicit none

integer, allocatable :: M(:), V(:), N(:)
integer :: i
integer (8) :: t1, t2, rate

M = [(i, i=1,1000000)]
V = [4, 3]

call system_clock (t1)
N = pack (M, [(all(M(i) /= V), i=1,size(M))])
call system_clock (t2, rate)

print *, N
print *, "Time:", real(t2-t1,8)/rate

end program exclude

gfortran exclude.f90 -oexclude -O3 -ftree-vectorize -flto -fopt-info-vec -march=native

Но для начала надо, чтобы программы делали одно и то же. То есть исключали повторяемые числа.

AcckiyGerman 25 апр в 12:29

import time

# prepare data
n, k = 10**6, 2

M = set(range(1, n))
V = set(range(1, k))

# start timer
start = time.time()

# calculate
Z = M - V

# finish timer
end = time.time()
print("time:", end - start)

# print values < 12
print(list(filter(lambda v: v<12, Z)))

python3 main.py 
time: 0.011850833892822266
[3, 4, 5, 6, 7, 8, 9, 10, 11]

11 мсек (ryzen 7600x), неплохо для питона, видно, что базовые операции хорошо оптимизированы.

vadimr 25 апр в 12:33

Просили-то из массива исключать, а не из множества. Для множества это вообще элементарная операция.

vadimr 25 апр в 12:30

При k не больше размера векторного регистра (т.е. в типовом современном случае для Intel – 8 или 16), это будет выполняться за O(n) векторных операций.

MarkNest 25 апр в 14:49

O(n) или O(k)?

vadimr 25 апр в 14:51

O(n). Нам же всё равно надо весь большой массив перебрать.

А без векторизации будет O(n*k).

MarkNest 25 апр в 14:54

Спасибо, понял.

xi-tauw 25 апр в 10:56

А можете расписать свои действия для случая M = {1, 2, 3, 4} V = {4, 1}?

MarkNest 25 апр в 12:22

Вас-то я и ждал! Спасибо! )) Значит, массив V тоже должен быть упорядочен.

wataru 25 апр в 12:42

Если массив V упорядочен, то можно что-то вроде операции слияния из сортировки слияния делать: сравниваем текущее число из M с текущим из V. Если меньшее в V, просто выбрасываем его. Если меньшее в M - выводим его в ответ. Если они равны, выбрасываем оба.

Alexandroppolus 25 апр в 12:46

массив V тоже должен быть упорядочен.

M = [1, 2, 3, 4]

V = [2, 4]

результат 2 4 3 2

MarkNest 25 апр в 14:25

Спасибо, что не даете мне писать глупости. Алгоритм работает, в описании у меня ошибка (сейчас исправлю).

M[1] <--> M[2]: M = {2,1,3,4}
M[2] <--> M[4]: M = {2,4,3,1}
результат: 3,1

jusd 25 апр в 13:35

Кроме упорядоченности V необходимо на каждой итерации использовать swap:

t=M[j]

M[j]=M[V[j]]

M[V[j]]=t

Тогда, индексы из V передвинутся в начало массива M.

MarkNest 25 апр в 14:26

да! Спасибо. Я сегодня сам не свой... Сейчас исправлю.

jusd 25 апр в 11:13

Вы можете доказать корректность алгоритма? Сомневаюсь в его работоспособности, даже если все числа в M и V различны.

MarkNest 25 апр в 14:35

уже доказали, пока я собирался))
https://habr.com/ru/articles/810327/comments/#comment_26760953

Rsa97 25 апр в 11:27

M = {1, 2, 3, 4}; V = {3, 1}
M[1] = V[1] = 3, M[V[1]] = M[3] = 1; M = {3, 2, 1, 4}
M[2] = V[2] = 1, M[V[2]] = M[1] = 2; M = {2, 1, 1, 4}
Хвост {1, 4}. Ошибка.

MarkNest 25 апр в 12:23

Да, массив V надо упорядочить. Я ошибался. Спасибо.

Rsa97 25 апр в 13:11

M = {1, 2, 3, 4}; V = {2, 3}
M[1] = V[1] = 2, M[V[1]] = M[2] = 1; M = {2, 1, 3, 4}
M[2] = V[2] = 3, M[V[2]] = M[3] = 2; M = {2, 3, 2, 4}
Хвост {2, 4}. Ошибка.
Могли бы и сами проверить свой гениальный алгоритм. Для |M| = 4 и |V| = 2 всего-то 12 вариантов надо перебрать.

wataru 25 апр в 13:38

Вторая помена должна поменять местами M[2] и M[3].

Это действительно работает. Поддерживается инвариант, что первые j элементов массива M содержат элементы из начала запрещенного массива V[1..j]. А элементы больше максимального V[1..j] не тронуты (M[i] = i, i > max(V[k] | k <= j)).

На каждой следующей итерации, поскольку V упорядочен, то V[j] >= j и M[v[j]] = j (по инварианту с предыдущей итерации). Поменяв местами M[v[j]] и M[j] мы восстановим инвариант: На индексах < j стоят вычеркнутые числа еще с предыдущей итерации. Вот тут мы в j-ый индекс поместили v[j]. Так же, мы испортили лишь v[j]-ый элемент, а значит все более правые элементы в массиве М все еще равны индексам.

Rsa97 25 апр в 13:45

Может и должна, но по алгоритму, предложенному автором, не меняет.
Вместо авторского M[j] = V[j]; M[V[j]] = j; должна быть [M[j], M[V[j]]] = [M[V[j]], M[j]]

wataru 25 апр в 13:50

Ну, автор же не на каком-то языке программирования писал. Это псевдокод. И словами описал это именно "перестановки". Не совсем точно описано, да, можно прочитать двояко.

Rsa97 25 апр в 13:51

Нет, у автора во втором выражении присваивается именно индекс, а не значение элемента по индексу.

wataru 25 апр в 14:10

У автора ничего не присваивается. У автора написано M[j] = V[j], M[V[j]] = j

Вы интерпретировали это как две последовательные операции присваивания. Автор же имел ввиду одну операцию: перестановку M[j] и M[V[j]]. Это понятно из контекста.

@MarkNest советую вам это в тексте подправить. Можно написать что-то вроде:
M[j], M[V[j]] = M[V[j]], M[j]илиswap(M[j], M[V[j]]).

Rsa97 25 апр в 14:17

Но и дальше в примерах видим то самое присвоение j.

M[1] = V[1] = 4, M[V[1]]= M[4] = 1; (теперь M = {4, 2, 3, 1}),
Так что непонятно, где именно вы нашли "контекст, из которого понятно".

vadimr 25 апр в 14:41

Ну ясно по логике, что там надо делать. Что индекс сам по себе никуда не впёрся.

MarkNest 25 апр в 14:39

Спасибо! )) Впредь буду долго думать, перед тем, как написать.

MarkNest 25 апр в 14:27

да описался я! Сейчас исправлю. Спасибо, что не даете писать глупости))

wataru 25 апр в 12:46

У вас уже есть массив M размера N, значит N не очень большое. Тогда можно в битовом массиве размера N пометить все числа из K, потом все числа из M выводить в ответ, если битовой пометки нет.

Это работает и для неупорядоченного массива K, в отличии от вашего алгоритма. Если вам медленно аллокации, то можно делать пометки прямо в массиве M в каких-нибудь старших битах (например, знак менять у чисел).

Если же и N и K очень большие, то можно использовать хеш-таблицу для пометок.

MarkNest 25 апр в 14:28

Спасибо!

wataru 25 апр в 15:23

Отдельное спасибо за КДПВ. Сами рисовали?

MarkNest 26 апр в 06:38

Вам спасибо за оценку))) Я не рисовал, но я старался выбрать получше.

Alexandroppolus 25 апр в 15:43

Насколько я понял, с поправками работает, если V упорядоченный. А если нет? Интересно, тогда можно допилить?

wataru 25 апр в 16:07

Отсортировать, ха-ха.

Кажется, за O(k), да с константной памятью (без хаков вроде использования лишних битов в M[]) - никак.

Ну, допустим, у нас такой алгоритм есть. А мы берем и последнее число в V[] произвольно меняем. Это значит, что алгоритм должен за константное количество операций найти это число в как-то перемешанном массиве M. Причем подбирая предыдущие числа в V мы можем очень сильно влиять на то, как массив перемешан. Кажется, это невозможно.

MarkNest 26 апр в 06:42

Очень бы хотелось, но, кажется, @wataru прав. Единственная надежда: упорядочивание V - это слишком строгое условие (иногда ведь перестановки срабатывают и без упорядочивания) - надежда очень слабая.

MarkNest 26 апр в 07:55

...

ALapinskas 25 апр в 18:22

Тоже сначала не понял с этими индексами и перестановками.

Получается так:

Для каждого значения V, найти индекс значения в массиве M.
В M итеративно переставить местами элементы на найденные индексы.
Получившийся массив разделить на размер V, правая часть будет решением.
Работает без сортировки, код на js:

function alg(M, V) {
  const len = V.length;
  for (let k = 0; k < len; k++) {
    // берем значение из M
    const iterationValue = M[k],
          // берем значение из V
          valV = V[k],
          // ищем V индекс в M
          index = M.indexOf(valV);
    
    // меняем местами элементы(swap)
    M[k] = valV;
    M[index] = iterationValue;
    
  }
  // 3. делим массив на длину V и возвращаем правую часть
  return M.slice(len);
}
alg([1, 2, 3, 4], [4, 1]);
// Array [ 3, 2 ]
alg([1, 2, 3, 4], [1, 4]); 
// Array [ 3, 2 ]
alg([1, 2, 3, 4], [3, 4]); 
// Array [ 1, 2 ]
alg([1, 2, 3, 4], [2, 1]); 
// Array [ 3, 4 ]
alg([3, 5, 4, 2, 8], [5, 2]);
// Array(3) [ 4, 3, 8 ]
alg([1, 2, 3, 4], [2, 4]);
// Array [ 3, 1 ]

wataru 25 апр в 19:20

Ваш метод сильно медленнее. Он работает за O(nk), когда как авторский за O(k). Ну или за O(k log k), если надо отсортировать.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

«А» и «Б» сидели на трубе. «А» упало, «Б» пропало. Что осталось на трубе? (алгоритм получения ответа в частном случае)

Комментарии 40

Публикации

Истории