Оглавление
В статье объясняется, как экспортировать различные PDF-файлы в Excel вручную или с помощью бесплатных онлайн-конвертеров, а также как выбрать метод преобразования, наиболее подходящий для данного типа файла.
Формат PDF, позволяющий представлять документы независимо от программного обеспечения, оборудования или операционной системы пользователя, уже стал стандартом де-факто для обмена электронными файлами.
Если вы попросите у кого-то какую-то информацию, и если этот кто-то - доброжелательный человек, есть большая вероятность, что вы получите аккуратно отформатированный PDF-документ с запрашиваемыми данными, сопровождаемый таблицами, графиками и диаграммами для ознакомления.
Однако файлы PDF предназначены исключительно для просмотра данных, а не для работы с ними. Поэтому, если ваша задача подразумевает изменение расположения данных для дальнейшего анализа, вам придется либо попросить корреспондента предоставить другой файл, либо преобразовать PDF-документ в какой-либо редактируемый формат. И в этом руководстве вы узнаете, как импортировать файл из PDF в Excel всего за несколько минут.
Выбор правильного метода преобразования PDF в Excel
Выбор правильного метода преобразования PDF в Excel зависит от того, как был создан тот или иной PDF-документ. Кто-то может подумать, что все PDF-файлы по сути одинаковы. Но на самом деле это не так.
Если документ PDF был получен из электронный источник Например, документ Word или таблица Excel, содержит текстовые символы, которые могут быть прочитаны и интерпретированы приложениями Microsoft Office, а также различными конвертерами PDF. Если вы хотите импортировать такой PDF в Excel, вы можете сделать это вручную или использовать сторонние конвертеры PDF в Excel или программное обеспечение Adobe.
Файл PDF также может быть создан путем сканирования какого-либо бумажного документа или с помощью другого устройства, которое принимает файл в формате PDF. изображение документа, а затем сохраняет его в виде PDF-файла. В данном случае PDF - это просто статичная картинка, и для того, чтобы экспортировать ее в редактируемый лист Excel, требуется специальное программное обеспечение OCR.
Преобразование PDF в Excel через Word
Для периодического преобразования PDF в Excel вы можете не утруждать себя поиском специального инструмента и обойтись тем, что у вас есть под рукой, т.е. любой программой просмотра PDF, Microsoft Excel и Word. Помните, что этот метод работает только с PDF-документами, созданными в электронном виде.
В двух словах, преобразование включает в себя экспорт данных сначала в документ Word, а затем их копирование в рабочую книгу Excel. Подробные шаги следуют ниже.
1. Скопируйте исходную таблицу из файла PDF.
Откройте файл PDF в Adobe Reader или любой другой программе просмотра PDF, выберите таблицу, которую вы хотите преобразовать в Excel, и нажмите Ctrl + C, чтобы скопировать ее в буфер обмена.
2. Вставьте таблицу в документ Word.
Откройте новый документ Word и вставьте скопированные данные, нажав Ctrl + V. У вас получится что-то похожее на это:
3. преобразуйте скопированные данные в таблицу (необязательно).
Если данные из PDF были вставлены в документ Word в виде правильно структурированной таблицы, как показано на скриншоте выше, пропустите этот шаг.
Если данные были вставлены в Word в виде текста, а не таблицы, их можно преобразовать в таблицу одним из следующих способов:
- Быстрый способ. Нажмите Ctrl + A, чтобы выделить все данные, переключитесь на Вставка вкладку и нажмите кнопку Таблица > Вставной стол...
Это должно преобразовать вставленные данные в плохо отформатированную, но правильно структурированную таблицу Word.
- Более длинный способ. Если быстрый способ не дал ожидаемого результата, выделите все данные и нажмите кнопку Вставка> Таблица>Преобразование текста в таблицу... Появится диалоговое окно, в котором выберите Другое по адресу Отдельный текст на , щелкните в маленьком окошке рядом с ним, удалите то, что там есть, введите пробел и нажмите кнопку OK .
4. Скопируйте таблицу из Word в Excel.
В документе Microsoft Word выделите все данные ( Ctrl + A ), откройте новый лист Excel, выделите любую ячейку (это будет самая левая ячейка таблицы) и нажмите Ctrl + V, чтобы вставить данные, скопированные из Word.
5. Форматирование и редактирование таблицы Excel.
Если вы конвертируете небольшую и простую таблицу, этот шаг может и не понадобиться. Однако, по моему опыту, это очень редкий случай, когда данные, экспортированные из PDF в Excel вручную, не требуют дальнейших манипуляций. Чаще всего вам потребуется внести некоторые корректировки, чтобы восстановить исходный макет и формат таблицы. Например, вам может понадобиться удалить некоторые пустые строки или добавить / удалитьотдельных ячеек, чтобы обеспечить правильное выравнивание столбцов.
Преимущества : Главное "Pro" этого подхода заключается в том, что не требуется никаких специальных инструментов, только программа для просмотра PDF, Microsoft Word и Excel.
Недостатки : Оригинальное форматирование потеряно, требуются дальнейшие манипуляции с преобразованными данными.
Конвертеры PDF в Excel онлайн
Если у вас большой и сложно отформатированный PDF-файл, восстанавливать формат и структуру каждой таблицы вручную может быть довольно утомительно. В этом случае имеет смысл поручить эту задачу какому-нибудь онлайн-конвертеру PDF в Excel.
Хотя существует большое разнообразие онлайн-конвертеров Excel в PDF, принцип работы в основном одинаков: вы загружаете PDF-файл на сайт, указываете свой адрес электронной почты и находите рабочую книгу Excel в своем почтовом ящике сразу после завершения процесса конвертации. Некоторые конвертеры даже не требуют адреса электронной почты и позволяют скачивать или открывать конвертированный файл Excel напрямую.с веб-сайта.
Большинство онлайн-конвертеров PDF в Excel имеют ежедневное или ежемесячное ограничение на количество файлов, которые вы можете конвертировать бесплатно. Некоторые сервисы также устанавливают ограничение на размер файла. Обычно эти ограничения можно снять, оформив платную подписку.
Сейчас мы поиграем с несколькими популярными онлайн-конвертерами PDF в Excel и посмотрим, какой из них дает наилучшие результаты.
А вот исходный PDF-файл, который нужно превратить в пригодную для работы таблицу Excel:
Nitro Cloud - бесплатный онлайн-конвертер PDF в Excel
Это один из самых популярных онлайн-сервисов для преобразования PDF-файлов в Microsoft Excel, Word и PowerPoint. Nitro Cloud также может выполнять преобразования в обратном направлении, то есть из PowerPoint, Word или Excel в PDF, и мы уже рассматривали его в предыдущей статье - Преобразование Excel в PDF.
Если у вас есть опыт работы с онлайн-сервисами, вы наверняка заметили, что они разработаны таким образом, чтобы сделать конвертацию максимально простой и интуитивно понятной для пользователя. Конвертер Nitro PDF не является исключением. Вам нужно только выбрать исходный файл, указать форматы файлов, ввести адрес электронной почты и нажать кнопку " Конвертировать сейчас ".
Результат : Преобразованный файл Excel придет в ваш почтовый ящик через пару минут. Например, вот как выглядит мой лист:
Если вы сравните его с оригинальным PDF-файлом, то заметите, что красивый заголовок исчез, форматирование существенно искажено, но в целом вам есть с чем работать.
Помимо онлайн-сервиса, у Nitro есть настольная версия конвертера PDF в Excel, 14-дневная пробная версия доступна по адресу www.pdftoexcelonline.com.
Бесплатный конвертер PDF
Онлайн-конвертер PDF, доступный на сайте www.freepdfconvert.com, также выполняет различные виды конвертации, включая PDF в Excel, PDF в Word, PDF в PowerPoint, PDF в изображение и наоборот.
С помощью этого конвертера вы можете получить выходной файл Excel по электронной почте или загрузить его с веб-сайта.
Результат : Что касается результата, ну... это было что-то запредельное!
Только 3 строки из исходного PDF-документа пережили конвертацию, и, естественно, эти остатки были сразу же отправлены в корзину. Справедливости ради стоит отметить, что этот конвертер PDF в Excel гораздо лучше справляется с более простыми таблицами, но, учитывая его ограничения - 10 конвертаций в месяц и 30-минутную задержку при конвертации другого файла, - я бы все равно не выбрал его.
Онлайн-конвертер Cometdocs PDF в Excel
Помимо Nitro, Cometdocs предлагает настольную и онлайновую версии своего PDF-конвертера, обе доступны на сайте www.pdftoexcel.org.
Их бесплатный сервис заставит вас ждать 30 минут даже для конвертирования первого документа, что, конечно, разочаровывает, но терпимо, если в итоге вы хотите получить идеальный результат.
Результат: Я бы не сказал, что выходной файл Excel идеален. Форматирование лишь смутно напоминает исходный документ PDF, появляется пара лишних пустых ячеек, тем не менее, главная цель достигнута - данные PDF превращены в редактируемую таблицу Excel.
Еще один онлайн-конвертер PDF
Как и большинство онлайн-сервисов, конвертер с понятным и незатейливым названием PDFConverter.com поможет вам импортировать содержимое ваших PDF-файлов в Excel, Word и PowerPoint. После выбора желаемого формата вывода вам предстоит выполнить обычные 3 шага - выбрать файл для конвертации, ввести адрес электронной почты и нажать кнопку Начало кнопка:
Также доступна платная версия этого PDF-конвертера для настольных компьютеров, которую можно загрузить в 15-дневной пробной версии здесь.
Результат : Довольно хорошо. На самом деле, лист Excel, который они прислали мне по электронной почте, был точно таким же, как у Cometdocs, вероятно, оба сервиса используют один и тот же алгоритм преобразования.
Если ни один из вышеперечисленных онлайн-конвертеров PDF в Excel не удовлетворил ваши требования в полной мере, вы можете найти в Интернете множество других.
Настольное программное обеспечение для конвертирования PDF в Excel
Если вам приходится регулярно выполнять преобразования PDF в Excel, и если быстрый и точный перевод исходных PDF-документов в отформатированные рабочие листы Excel - это то, что вам нужно, вы можете рассмотреть возможность инвестирования в профессиональное программное обеспечение для настольных компьютеров.
Экспорт PDF в Excel с помощью Adobe Acrobat XI Pro
Начнем с того, что подписка на Adobe Acrobat Pro стоит довольно дорого (около $25 в месяц), но цена, вероятно, оправдана, поскольку она включает в себя множество функций, позволяющих выполнять все возможные манипуляции с PDF-файлами, включая возможность импорта PDF в Excel.
Процесс конвертации очень быстрый и простой:
- Откройте файл PDF в программе Acrobat XI.
- Нажмите Инструменты> Редактирование контента> Экспорт файла в.> Рабочую книгу Microsoft Excel .
Если вы предпочитаете работать с главным меню, нажмите кнопку Файл> Сохранить как другой.> Электронная таблица> Рабочая книга Microsoft Excel. Если кто-то все еще использует Excel 2003, выберите Электронная таблица XML 2003 вместо этого.
- Дайте имя файлу Excel и выберите папку назначения.
Если у вас есть учетная запись Adobe, вы можете сохранить преобразованный файл .xlsx в ней, нажав на маленькую черную стрелку рядом с " Сохранить в онлайн-аккаунте " в нижней части окна.
После выбора папки нажмите кнопку Сохранить для завершения преобразования или Настройки для получения дополнительных возможностей.
- Настройте параметры.
В " Сохранить как XLSX Настройки " диалогового окна, у вас есть следующие варианты выбора:
- Преобразуйте PDF-файл в один рабочий лист или экспортируйте каждую страницу в отдельный лист.
- Используйте десятичные и тысячные разделители по умолчанию (как установлено в региональных настройках Windows) или установите другие разделители специально для этого файла Excel.
- При необходимости включите OCR (оптическое распознавание символов). Хотя эта опция выбрана по умолчанию, она заслуживает особого внимания, если вы конвертируете PDF-документ с изображением (отсканированный). В этом случае убедитесь, что в чекбоксе "Запустить OCR" стоит галочка, и выберите соответствующий язык, нажав на кнопку Установить язык кнопку рядом с ним.
После этого нажмите кнопку OK.
Конвертированный файл Excel очень близок к исходному документу PDF. Как показано на скриншоте ниже, макет документа, а также форматирование были преобразованы практически безупречно. Единственный заметный недостаток - некоторые числа были экспортированы как текст, о чем свидетельствует маленький зеленый треугольник в левом верхнем углу ячейки. Вы можете устранить этот недостаток за несколько секунд - достаточно простовыберите все такие ячейки, щелкните правой кнопкой мыши и выберите Формат ячеек> Число .
Справедливости ради, я использовал Acrobat Pro XI для преобразования того же PDF-файла, который был отправлен в онлайн-конвертер PDF to Excel. Результат очень разочаровал:
Как вы видите на скриншоте выше, некоторые числа, которые должны быть связаны с текстовыми метками, перемещены в верхнюю часть листа, одна текстовая запись потеряна. Но самое главное, что все данные были экспортированы в один столбец (столбец A), что значительно усложняет дальнейшие манипуляции и анализ данных. Даже некоторые бесплатные онлайн PDF-конвертеры дали лучший результат - позор Adobe!
Преимущества : Прежде всего - очень быстрый результат и простота использования; для простых таблиц с четкой структурой - аккуратные и точные преобразования с минимальными дополнительными манипуляциями.
Недостатки : Высокая стоимость, низкие результаты при конвертировании сложных PDF-документов.
Преобразование PDF в Excel с помощью Able2Extract PDF Converter 9
Able2Extract - еще одно громкое имя в отрасли, которое присутствует на рынке уже более 10 лет. Их цены сопоставимы с Adobe Acrobat Pro, как и возможности.
Able2Extract может переносить содержимое PDF в большое количество форматов - от Excel, Word, PowerPoint до Publisher и AutoCAD. Также доступна опция оптического распознавания символов (OCR).
А теперь давайте посмотрим, как этот конвертер справится с нашим Gift Planner, который оказался камнем преткновения как для большинства онлайн-конвертеров PDF, так и для программ Adobe.
Чтобы преобразовать PDF в редактируемый файл Excel, выполните следующие действия:
- Откройте документ PDF, который нужно экспортировать в Excel. Конвертер подскажет вам, с чего начать.
- Выберите данные PDF для конвертирования. Это может быть весь документ, определенные страницы, все данные на текущей странице или только выбранные данные. Вы можете сделать выбор, перетащив указатель мыши, из Редактировать меню или с помощью опций быстрого выбора на панели инструментов:
- Выберите Excel в качестве формата преобразования, либо нажав кнопку Excel на панели инструментов или выберите Конвертировать в Excel из Редактировать меню. После этого вам будет предложено на выбор Автоматический и Пользовательский варианты конвертации.
Я выбираю Автоматический так как мне нужен быстрый результат. Если вы хотите обозначить, как будет выглядеть ваша таблица в Excel, вы можете воспользоваться функцией Пользовательский Когда вы нажимаете на кнопку Определить кнопка под Пользовательский появится новая панель, из которой вы можете начать корректировать таблицы, и изменения будут немедленно отражены в разделе предварительного просмотра.
То, что вы видите ниже, является результатом автоматического преобразования, который намного превосходит то, что создал Adobe Acrobat XI Pro!
Если вы хотите попробовать Able2Extract, вы можете загрузить ознакомительную версию здесь или, возможно, сначала проверить их цены :)
Преимущества : Быстрое и точное преобразование PDF в Excel; сохранение оригинальных цветов, форматирования и шрифтов; возможность настройки документа перед преобразованием; возможность OCR для отсканированных PDF.
Недостатки : Дорого.
Преобразование изображения (отсканированного) PDF в Excel
Как отмечалось в начале статьи, существует более одного способа создания PDF-файла. Если ваш PDF был создан с помощью сканера или аналогичного устройства, которое делает "моментальный снимок" документа и затем сохраняет это изображение в виде электронного PDF-файла, специальные Оптическое распознавание символов (OCR) требуется программное обеспечение. Программа OCR электронно идентифицирует каждый символ в отсканированном документе и преобразует его в редактируемый формат по вашему выбору, например, в Microsoft Excel.
Качество выходного документа зависит от многих факторов, таких как хорошее или плохое качество изображения исходного PDF-документа, четкость всех символов, иностранных языков или специальных символов, используемых в тексте, смешение шрифтов, цветов и форматов и т.д.
Поскольку оптическое распознавание символов, превращающее изображение в электронный файл с символами, является довольно сложным процессом, большинство программ OCR являются платными. Однако существует и несколько бесплатных онлайн-сервисов, которые могут помочь вам экспортировать "образ" PDF-документа в Excel.
Бесплатный онлайн-сервис OCR для преобразования PDF в Excel
Сервис оптического распознавания символов, доступный на сайте www.onlineocr.net, поддерживает 46 языков, включая английский, французский, китайский, японский, корейский и многие другие. Помимо PDF, он также позволяет извлекать текст из изображений JPG, BMP, TIFF и GIF и конвертировать их в файлы Excel (.xlxs), Word (.docx) или обычный текст (.txt). Максимально допустимый размер файла - 5 МБ.
Я протестировал этот сервис на нескольких отсканированных PDF-документах на разных языках и, честно говоря, был впечатлен результатами. Хотя исходный формат PDF-файлов был потерян, большинство текстовых и числовых данных были распознаны и корректно импортированы в Excel.
Если вам нужно что-то большее, чем бесплатный сервис OCR, вы можете попробовать один из платных конвертеров PDF в Excel OCR, например, PDF2XL OCR или VeryPDF.
И естественно, если у вас есть лицензия Adobe Acrobat XI Pro, вам не понадобятся никакие другие инструменты или услуги, просто используйте " При необходимости запустите OCR ", как показано в разделе Экспорт PDF в Excel с помощью Adobe Acrobat.
Надеюсь, эта статья помогла вам выбрать метод или инструмент для преобразования PDF в Excel, наиболее подходящий для ваших нужд и типа импортируемых данных. Если вы ищете противоположное решение, вы можете найти его в этой статье - Экспорт файлов Excel в PDF. Спасибо за чтение!