как разбить файл на части в линукс
Кратко: split — разделяем файлы
Давненько я тут не писал, хотя заметок накопилось немало.. и начну я пока с кратких заметок. Сегодня речь пойдет об утилите split. Данная утилита позволяет разбивать файлы на несколько частей.
Когда это может быть полезным? Ну к примеру вам может потребоваться разделить большой лог-файл для того, чтобы было удобнее анализировать его на наличие ошибок. Второй вариант — разделить большой архив (что мне и потребовалось) для того, чтобы загрузить его частями на облако, в котором есть ограничения по размеру файлов…
Ниже будет представлено несколько вариантов использования этой утилиты, и начну я с самого распространенного.
Как разделить большой архив на несколько файлов по 15gb?
Самый простой способ:
В результате вы получите файлы, начинающиеся с префикса «x»:
А как сделать тоже самое, только с нормальным именем?
В этой ситуации достаточно добавить желаемую маску, указав ее в кавычках после выбранного файла:
В результате архив будет разделен на эти файлы:
Как заменить эти aa ab на цифры?
Результат будет такой:
Что еще можно сделать с суффиксом?
Можно увеличить его длину (по умолчанию длина суффикса — 2). Сделать это можно, например до 4, с помощью ключа «-a 4»:
Еще можно использовать шестнадцатеричный суффикс, воспользовавшись ключом «-x». Но на нем я не буду останавливаться.
Как разделить архив на два файла?
В результате мы получим два файла, разделенные «пополам» как и хотели:
А как теперь собрать все части в один архив?
Это нельзя сделать с помощью split, но можно с помощью cat. Ниже пример того, как я собрал все части в один архив и сверил размер и чексум оригинального файла и «воссозданного»:
Как мы видим, архив «воссоздан» и готов к распаковке.
Как понять, что делает эта утилита?
На помощь приходит ключ —verbose:
Как split работает с текстовыми файлами?
По умолчанию эта утилита делит файл создавая новый файл, который содержит 1000 строк. К примеру, у меня есть файл который содержит 11266 строк. Вот на сколько файлов/и как он будет разделен:
Как мне разделить файл на несколько файлов по 3000 строк?
Как разделить текстовый файл по 300кб не ломая структуру?
Как разделить файл на основе определенного контента?
В этом утилита split нам не поможет, но поможет csplit. Возможно о ней будет написана отдельная статья.
Изучаем команды linux: split
1. Введение
Если вы не слышали о команде split, вы многое потеряли. Как можно понять из ее названия, эта команда может помочь вам разделить файл на несколько меньших файлов. split работает с любыми файлами, как текстовыми, так и бинарными. Это очень полезно, если ваш файл не помещается на флешку, или вам нужно отправить большой файл по электронной почте. Вы также можете разделять большие текстовые файлы, такие как логи, на несколько частей заданного размера. В данной статье описан синтакис и применение команды split.
2. Часто используемые опции
3. Разрезание файла на части заданного размера
Если не используется опция suffix, по умолчанию команда split будет разделять файлы на части, название которых будет начинаться с x, за которым будут следовать еще два символа в алфавитном порядке. Например, первый файл будет называться xaa, за которым будет идти xab, xac, а последний файл будет называться xzz. Это значит, что в данном случае вы можете разбить свой файл не более чем на 676 частей (26×26). Возьмем для примера файл размером 10 Мб:
4. Разрезание файла на заданное количество частей
5. Использование числовых суффиксов
Команда split позволяет создавать файлы с числовыми суффиксами вместо символьных. Приведенная ниже команда создает файл для каждого символа в строке «linuxcareer.com». Секрет заключается в том, что мы разрезаем файл, задавая размер части в байтах, а 1 байт эквивалентен 1 символу. Также вместо символьных мы используем числовые суффиксы:
6. Восстановление исходного файла
Разрезать файл легко, но как собрать его обратно? Допустим, у нас есть какой-либо ISO-образ, и мы хотим разделить его пополам.
Мы можем восстановить исходный файл ubuntu-12.04.1-server-amd64.iso, используя команду cat и оператор перенаправления STDOUT:
Чтобы убедиться, что файл restored-ubuntu-12.04.1-server-amd64.iso восстановлен корректно и представляет собой точную копию оригинального файла ubuntu-12.04.1-server-amd64.iso, мы используем команду md5sum для создания контрольной суммы обоих файлов:
Как вы можете видеть, восстановленный файл является точной копией исходного, так как их контрольные суммы совпадают.
7. Разрезание архивов tar на лету
Теперь, когда мы ознакомились с основами, рассмотрим более сложный пример.
В приведенном ниже примере мы архивируем директорию /tmp/Software. Однако вместо создания архива мы разрежем его на лету с помощью команды split.
Как вы можете видеть, наш архив диретории /tmp/Software разрезан на части с максимальным размером 2 Мб. Далее мы восстановим исходную директорию:
8. Заключение
Как вы можете видеть, при использовании операционной системы GNU/Linux вы ограничены только своим воображением и навыками, а не размером вашего кошелька. В данной статье описаны только основы работы с командой split. Узнать больше вы можете с помощью команды:
9 полезных примеров команды Split в Linux
Главное меню » Операционная система Linux » 9 полезных примеров команды Split в Linux
Обратите внимание, что мы не будем отображать вывод напрямую в этих примерах из-за больших размеров файлов. Мы будем использовать команды ll и wc для выделения изменений файла.
Мы советуем вам быстро взглянуть на команду wc, чтобы понять вывод примеров команды split.
Примеры команды Split в Linux
Синтаксис команды Split:
Давайте посмотрим, как использовать его для разделения файлов в Linux.
1. Разделите файлы на несколько файлов
По умолчанию команда split создает новые файлы для каждых 1000 строк. Если префикс не указан, он будет использовать ‘x’. Следующие буквы перечисляют файлы, поэтому сначала идет xaa, затем xab и так далее.
Давайте разделим пример файла журнала:
Если вы используете команду ls, вы можете увидеть несколько новых файлов в вашем каталоге.
Вы можете использовать wc для быстрой проверки количества строк после разделения.
Помните, что ранее мы видели, что наш исходный файл содержал 17 170 строк. Таким образом, мы можем видеть, что наша программа создала как и ожидалось, 18 новых файлов. 17 из них заполнены 1000 строками в каждой, а последняя имеет оставшиеся 170 строк.
Другой способ продемонстрировать, что происходит, – запустить команду с параметром verbose. Если вы не знакомы с verbose, вы пропускаете! Он предоставляет более подробные отзывы о том, что делает ваша система, и он доступен для использования со многими командами.
Вы можете увидеть, что происходит с вашей командой на дисплее:
2. Разделите файлы на несколько файлов с определенными номерами строк
Теперь вы можете указать, сколько строк вы хотите в каждом из новых файлов.
Как вы можете догадаться, теперь разделенные файлы имеют по 500 строк каждая, кроме последней.
Теперь у вас есть намного больше файлов, но с половиной строк в каждом.
3. Разделение файлов на n файлов
Теперь вы можете видеть, что есть 15 новых файлов.
4. Разделение файлов с пользовательским префиксом имени
Что делать, если вы хотите использовать split, но оставить оригинальное имя моего файла или вообще создать новое имя вместо ‘x’?
Возможно, вы помните, что видели префикс как часть синтаксиса, описанного в начале статьи. Вы можете написать свое собственное имя файла после исходного файла.
Вот разделенные файлы с именами, начинающимися с данного префикса.
5. Разделите и укажите длину суффикса
Разделение имеет длину суффикса по умолчанию 2 [aa, ab и т. д.]. Это изменится автоматически при увеличении количества файлов, но если вы хотите изменить его вручную, это тоже возможно. Допустим, вы хотите, чтобы наши файлы были названы как-то вроде AndreyExSeparatedLogFiles.log_aaaab.
И вот разделенные файлы:
6. Разделить с помощью числового суффикса заказа
До этого момента вы видели, что ваши файлы разделены с использованием различных буквенных комбинаций. Лично нам гораздо проще различать файлы по номерам.
Так что теперь у вас будут разделенные файлы с числовыми значениями.
7. Добавьте шестнадцатеричные суффиксы для разделения файлов
Другой вариант создания суффикса – использовать встроенный шестнадцатеричный суффикс, который чередует упорядоченные буквы и цифры.
В этом примере мы объединяем несколько вещей, которые мы вам уже показали. Мы разделим файл, используя свой собственный префикс и выбрали подчеркивание для удобства чтения.
И вот результат вышеупомянутой команды:
8. Разделите файлы на несколько файлов определенного размера
Также возможно использовать размер файла, чтобы разбить файлы в разбивке. Возможно, вам нужно отправить большой файл по сети с ограниченным размером как можно более эффективно. Вы можете указать точный размер для ваших требований.
Синтаксис может стать немного сложнее, так как мы продолжаем добавлять опции. Итак, мы объясним, как работает команда, прежде чем показывать пример.
Может показаться, что многое происходит, но это не так сложно, когда разбиваешь это. Вы указали исходный файл, наш префикс имени файла назначения, числовой суффикс и разделение по размеру файла 128 КБ.
Вот разделенные файлы:
Вы можете проверить результат с помощью команды wc.
9. Разбивка файлов на несколько с определенным размером файла
В выводе вы можете видеть, что первый разделенный файл имеет размер около 1 МБ, тогда как остальная часть файла находится во втором файле.
Бонусный совет: воссоединение разделенных файлов
Это не команда split, но она может быть полезна для новых пользователей.
Вы можете использовать другую команду, чтобы присоединиться к этим файлам и создать копию нашего полного документа. Команда cat – это сокращение от конкатенации, это просто причудливое слово, означающее «объединить элементы вместе». Поскольку все файлы начинаются с буквы «х», звездочка будет применять команду ко всем файлам, которые начинаются с этой буквы.
Как видите, наш воссозданный файл имеет тот же размер, что и наш оригинал.
Наше форматирование (включая количество строк) сохраняется в созданном файле.
Если вы новичок в Linux, мы надеемся, что это руководство помогло вам понять команду split. Если вы более опытны, расскажите нам ваш любимый способ использовать разделение в комментариях ниже!
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.
Справочная информация
про свой опыт решения некоторых проблем и использования ряда возможностей ОС и приложений
понедельник, 6 июня 2016 г.
Разрезать и склеить файл в Linux без терминала. Split и Join с GUI
Необходимость в использовании инструментов разрезания и склейки файлов в Linux у меня ранее не возникало. Для передачи больших файлов с целью обмена мной успешно использовались файлообменные ресурсы, например, те же depositfiles или filefactory, предоставляющие время хранения не менее 90 суток. В связи с тем, что depositfiles предоставил свой менеджер файлов, с помощью которого успешно осуществлялась операция Upload, этот ресурс и использовался чаще всего.
Радикальным образом ситуация изменилась буквально за последние 2 дня. Загруженный мной для обмена файл был в течение дня удалён. Так как администрация этого сервиса вправе удалить любой файл без объяснения причин, то пришлось вернуться к широко использовавшемуся мной ранее файлообменнику Sendspace. А так как этот ресурс позволяет передать файлы не более 300 Мб, то у меня возникла проблема передачи файлов размером в 1,5 Гб.
Другой возможной необходимостью разбить и склеить файл является принципиальная невозможность записать на флэшку с файловой системой FAT32 файл размером более 4 Гб, что обусловлено свойствами самой файловой системы FAT32.
Поиск способов в Linux привёл в инструкции:
При всём уважении к терминалу хотелось бы чего-то более привычного, тем более, что мои респонденты, несмотря на их работу в Linux, вряд ли были бы в восторге от необходимости склеивать переданные им файлы в терминале.
Поискав в центре приложений своего Linux Mint по запросу в строке поиска split было найдено 2 варианта решения проблемы.
1 вариант – Gmone Split
Так как в Linux Mint ПО унифицировано для различных оболочек, то данное ПО присутствует и для Cinnamon, и для MATE и XFCE. Естественно, что данное ПО должно быть установлено как у Вас, так и тех, кому Вы будете передавать обработанные этим ПО файлы. После установки в меню программ появляется отображение, например,
При запуске программы отображается мастер (другими словами – Wizard), который будет «руководить» Вашими дальнейшими действиями.
Split a file – разрезать файл
Merge several files – склеить несколько файлов
Слева отображается полное меню, в котором выполняемая операция подсвечивается выделением:
В нижней части справа отображены кнопки дальнейших действий.
Если действие указано, то кнопка «Продолжить» становится активной. Если нажать «Отмена», то доступно главное окно программы, до этого «прикрытое» мастером.
В окне выбора файлов укажите файл, а затем способ его разбиения:
По умолчанию предлагается указать, на сколько частей разбивать выбранный файл. При этом размер каждого фрагмента будет определён программой самостоятельно. Но если нажать на стрелочку справа, то отобразятся и другие варианты:
В поле слева необходимо указать количество этих самых частей или размер в байтах, Кб, Мб, Гб и т.д.
Далее предлагается выбрать рабочий алгоритм:
Признаться откровенно, мной был испробован вариант только «Общий». Про назначение других вариантов ничего не могу сказать.
Перед самим процессом предлагается проверить выбранные настройки и при необходимости внести изменения, если где-то была допущена ошибка (размер отдельного фрагмента или способа разбиения):
Процесс разбиения файла отображается в графическом режиме:
На выходе получится склеенный файл.
2 вариант – HJSplit
Этот вариант найден со ссылки от консольной утилиты LXSplit, в описании которой указано на её совместимость с программной HJSplit
Само собой разумеется, что Ваши респонденты также должны установить у себя такую же программу.
Пользователи Linux обращаются к секции Линукса и скачивают архив hjsplitlx.tar.gz В составе архива имеется сама программа и описание в виде файла txt «что это такое и с чем его едят».
Собственно программой является файл hjsplit. Проверьте, имеется ли у Вас указание на необходимость запуска этого файла как программы:
Интерфейс интуитивно понятен. Split – разрезать, Join – склеить. Сравнением (Compare) и контрольными суммами (Checksum) Вы вряд ли будете заниматься.
Нажимаете «Split», указываете файл, размер каждого фрагмента и нажимаете кнопку «Start».
Процесс отображается графическим индикатором, а по завершении выводится информационное сообщение.
Как разрезать и соединять файлы в командной строке Linux
Оригинал: How To Split And Combine Files From Command Line In Linux
Автор: SK
Дата публикации: 2 мая 2017 года
Перевод: А. Кривошей
Дата перевода: сентябрь 2017 г.
На моем ноутбуке хранится множество обучающих видео по Linux. Я хотел бы загрузить их все на Google Drive, чтобы иметь резервные копии. Проблема в том, что эти видеоролики размером более 1 гигабайта, что плохо подходит для загрузки на диск Google. Несмотря на то, что Google Drive поддерживает загрузку файлов размером до 5 Тб, на практике для загрузки больших файлов требуется слишком много времени. Рассматривая эту проблему, я понял, что было бы намного лучше, если бы я мог разделить эти файлы на меньший размер и загружать их по одному. Затем я могу загрузить все части файла и объединить их все, когда захочу. Есть простая утилита командной строки, называемая «split», которая используется для разделения больших файлов на несколько файлов меньшего размера, и вы можете позже соединить все эти части в один файл.
В этом кратком руководстве я покажу вам, как разрезать и соединять файлы в командной строке Unix-подобных операционных систем.
Разрезание файлов в командной строке
Давайте посмотрим на размер этого видеоролика.
Как вы можете видеть, размер видео 1,1 Гб, что очень много для загрузки на мой диск google. С моей скоростью интернет-соединения это займет более 30 минут. Я не хочу ждать так долго. Поэтому я хочу разделить файл на несколько частей, например по 100 Мб, чтобы потом быстро загрузить их одну за одной.
Для этого используем команду:
Команда создаст файлы ls.aa, ls.ab, ls.ac.. и так далее, размером по 100 Мб.
Посмотрим, что теперь у нас в директории:
Файл Linux Security.mp4 разрезан на части с именами ls.aa, ls.ab …. ls.ak, каждая по 100 Мб.
Теперь намного проще отправить их в качестве вложения в электронное письмо.
Объединение файлов в командной строке
Перейдем в директорию, где лежат все части нашего файла и объединим их в один файл.
Разделим тот же файл с помощью команды split без указания каких-либо аргументов, как показано ниже.
Эта команда разрежет файл Linux Security.mp4 на множество файлов с именами вида x**.
Каждый файл содержит 1000 строк. Вы можете убедиться в этом с помощью команды wc (word count):
Объединить все эти части в один файл можно с помощью команды:
Приведенная выше команда объединит все файлы в один с именем ls.mp4.
Заключение
Немного подробнее о команде split вы можете узнать из следующей статьи: «Изучаем команды linux: split»