Skip to content

Latest commit

 

History

History
73 lines (55 loc) · 2.98 KB

lng-java.md

File metadata and controls

73 lines (55 loc) · 2.98 KB

Задание

С помощью Java:

  1. Считать файл (https://github.com/PeacockTeam/new-job/releases/download/v1.0/lng-4.txt.gz), состоящий из строк вида
A1;B1;C1
A2;B2;C2
A3;B3
...

Note

в строке может быть неограниченное число элементов

  1. Найти множество уникальных строчек и разбить его на непересекающиеся группы по следующему критерию:

Если две строчки имеют совпадения непустых значений в одной или более колонках, они принадлежат одной группе.

Например, строчки

111;123;222
200;123;100
300;;100

все принадлежат одной группе, так как первые две строчки имеют одинаковое значение 123 во второй колонке, а две последние одинаковое значение 100 в третьей колонке

строки

100;200;300
200;300;100

не должны быть в одной группе, так как значение 200 находится в разных колонках

  1. Вывести полученные группы в файл в следующем формате:
Группа 1
строчка1
строчка2
строчка3
...

Группа 2 
строчка1
строчка2
строчка3
  • В начале вывода указать получившиееся число групп с более чем одним элементом.
  • Сверху расположить группы с наибольшим числом элементов.
  1. После выполнения задания необходимо отправить количество полученных групп с более чем одним элементом и время выполнения программы (мы не проверяем код если ответ неверный).
  2. Код необходимо выложить на github или gitlab.

Требования

  1. Допустимое время работы - до 30 секунд.
  2. Проект должен собираться с помощью maven или gradle в исполняемый jar.
  3. jar должен запускаться следующим образом: java -jar {название проекта}.jar тестовый-файл.txt
  4. Алгоритм не должен потреблять > 1Гб памяти (запускать с ограничением по памяти -Xmx1G)

Примечание

  1. Строки вида
 "8383"200000741652251"
 "79855053897"83100000580443402";"200000133000191"

являются некорректными и должны пропускаться

  1. Если в группе две одинаковых строки - нужно оставить одну