50 оттенков go
1. Открывающую фигурную скобку нельзя размещать в отдельной строке
В большинстве других языков, использующих фигурные скобки, вам нужно выбирать, где их размещать. Go выбивается из правила. За это вы можете благодарить автоматическую вставку точки с запятой (точка с запятой предполагается в конце каждой строки, без анализа следующей). Да, в Go есть точка с запятой! Неправильно:
Ошибка компилирования:
Правильно:
2. Неиспользуемые переменные
Если у вас есть неиспользуемые переменные, то код не скомпилируется. Исключение: переменные, которые объявляются внутри функций. Это правило не касается глобальных переменных. Также можно иметь неиспользуемые аргументы функций. Если вы присвоили неиспользуемой переменной новое значение, то ваш код всё равно не будет компилироваться. Придётся её где-то использовать, чтобы угодить компилятору. Неправильно:
Ошибки компилирования:
Правильно:
Другое решение: комментировать или удалять неиспользуемые переменные.
3. Неиспользуемые импорты
Если вы импортируете пакет и потом не используете какие-либо из его функций, интерфейсов, структур или переменных, то код не скомпилируется. Если нужно импортировать пакет, идентификатор «_» в качестве его имени поможет избежать ошибок компилирования. Идентификатор «_» чаще всего применяется для использования сайд-эффектов импортированных библиотек. Неправильно:
Ошибки компилирования:
Правильно:
4. Короткие объявления переменных можно использовать только внутри функций
Неправильно:
Ошибка компилирования:
Правильно:
5. Переобъявления переменных с помощью коротких объявлений
В одной области видимости выражения нельзя переобъявлять переменные, но это можно делать в объявлении нескольких переменных (multi-variable declarations), среди которых хотя бы одна — новая. Переобъявляемые переменные должны располагаться в том же блоке, иначе получится скрытая переменная (shadowed variable). Неправильно:
Ошибка компилирования:
Правильно:
6. Нельзя использовать короткие объявления переменных для настройки значений полей
Неправильно:
Ошибка компилирования:
Хотя разработчикам Go уже предлагали это исправить, не стоит надеяться на перемены: Робу Пайку нравится всё «как есть». Вам помогут временные переменные. Или предварительно объявляйте все свои переменные и используйте стандартный оператор присваивания. Правильно:
7. Случайное сокрытие переменных
Синтаксис короткого объявления переменных так удобен (особенно для тех, кто пришёл в Go из динамических языков), что его легко принять за регулярную операцию присваивания. Если вы сделаете эту ошибку в новом блоке кода, то компилятор не выдаст ошибку, но приложение будет работать некорректно.
Это очень распространённая ошибка даже среди опытных Go-разработчиков. Её легко совершить и трудно заметить. Для выявления подобных ситуаций можно использовать команду vet. По умолчанию она не выполняет проверку переменных на скрытость. Поэтому используйте флаг -shadow: go tool vet -shadow your_file.go
8. Нельзя использовать nil для инициализации переменной без явного указания типа
Идентификатор nil
можно использовать как «нулевое значение» (zero value) для интерфейсов, функций, указателей, хеш-таблиц (map), слайсов (slices) и каналов. Если не задать тип переменной, то компилятор не сможет завершить работу, потому что не сумеет угадать тип.
Неправильно:
Ошибка компилирования:
Правильно:
9. Использование nil-слайсов (slice) и хеш-таблиц (map)
Можно добавлять элементы в nil
-слайс, но если то же самое сделать с хеш-таблицей, то это приведёт к runtime panic.
Правильно:
Неправильно:
10. Ёмкость хеш-таблиц
Можно устанавливать ёмкость при создании хеш-таблиц, но нельзя применять к ним функцию cap()
.
Неправильно:
Ошибка компилирования:
11. Строки не могут быть nil
Это подводный камень для начинающих, которые присваивают строковым переменным nil
-идентификаторы.
Неправильно:
Ошибки компилирования:
Правильно: package main
12. Передача массивов в функции
Если вы разрабатываете на С/С++, то массивы для вас — указатели. Когда вы передаёте массивы функциям, функции ссылаются на ту же область памяти и поэтому могут обновлять исходные данные. В Go массивы являются значениями, так что, когда мы передаём их функциям, те получают копию исходного массива. Это может стать проблемой, если вы пытаетесь обновлять данные в массиве.
Если нужно обновить исходные данные в массиве, используйте типы указателей массива.
Другое решение: слайсы. Хотя ваша функция получает копию переменной слайса, та всё ещё является ссылкой на исходные данные.
13. Неожиданные значения в выражениях range в слайсах и массивах
Это может произойти, если вы привыкли к выражениям for-in
или foreach
в других языках. Но в Go выражение range
отличается тем, что оно генерирует два значения: первое — это индекс элемента (item index), а второе — данные элемента (item data).
Неправильно:
Правильно:
14. Одномерность слайсов и массивов
Кажется, что Go поддерживает многомерные массивы и слайсы? Нет, это не так. Хотя можно создавать массивы из массивов и слайсы из слайсов. С точки зрения производительности и сложности — далеко не идеальное решение для приложений, которые выполняют числовые вычисления и основаны на динамических многомерных массивах. Можно создавать динамические многомерные массивы с помощью обычных одномерных массивов, слайсов из «независимых» слайсов, а также слайсов из слайсов «с совместно используемыми данными». Если вы используете обычные одномерные массивы, то при их росте вы отвечаете за индексирование, проверку границ и перераспределение памяти. Процесс создания динамического многомерного массива с помощью слайсов из «независимых» слайсов состоит из двух шагов. Сначала нужно создать внешний слайс, а затем разместить в памяти все внутренние слайсы. Внутренние слайсы не зависят друг от друга. Их можно увеличивать и уменьшать, не затрагивая другие.
Создание динамического многомерного массива с помощью слайсов из слайсов «с совместно используемыми данными» состоит из трёх шагов. Сначала нужно создать слайс, выполняющий роль «контейнера» данных, он содержит исходные данные (raw data). Затем — внешний слайс. В конце мы инициализируем каждый из внутренних слайсов, перенарезая слайс с исходными данными.
Предлагается разработать спецификацию на многомерные массивы и слайсы, но сейчас, судя по всему, у этой задачи низкий приоритет.
15. Обращение к несуществующим ключам в map
Эту ошибку совершают разработчики, которые при обращении к несуществующему ключу ожидают получить nil
-значение (как это происходит в некоторых языках). Возвращаемое значение будет nil
, если «нулевое значение» для соответствующего типа данных — nil
. Но для других типов возвращаемое значение окажется другим. Определять, существует ли запись в хеш-таблице (map record), можно с помощью проверки на правильное «нулевое значение». Но это не всегда надёжно (например, что вы будете делать, если у вас есть таблица булевых значений, где «нулевое значение» — false). Самый надёжный способ узнать, существует ли запись, — проверить второе значение, возвращаемое операцией доступа к таблице.
Плохо:
Хорошо:
16. Неизменяемость строк
Если вы попытаетесь обновить отдельные символы строковой переменной с помощь оператора индекса, то это не сработает. Строки — это байт-слайсы (byte slices), доступные только для чтения. Если вам все-таки нужно обновить строку, то стоит использовать байт-слайс и преобразовывать его в строку по необходимости. Неправильно:
Ошибка компилирования:
Правильно:
Стоит заметить, что это неправильный способ обновления символов в текстовой строке, потому что символ может состоять из нескольких байтов. В этом случае лучше конвертировать строку в слайс из «рун» (rune). Но даже внутри слайсов из «рун» одиночный символ может быть разбит на несколько рун, например если есть символ апострофа (grave accent). Такая непростая и запутанная природа «символов» является причиной того, что в Go строковые значения представляют собой последовательностей байтов.
17. Преобразование строк в байт-слайсы (Byte Slices), и наоборот
Когда вы преобразуете строку в байт-слайс (и наоборот), вы получаете полную копию исходных данных. Это не операция приведения (cast operation), как в других языках, и не перенарезка (reslicing), когда переменная нового слайса указывает на один и тот же массив, занятый исходным байт-слайсом.
В Go есть несколько оптимизаций для преобразований из []byte
в string
и из string
в []byte
, позволяющих избегать дополнительных выделений памяти (ещё больше оптимизаций в списке todo).
Первая оптимизация позволяет избежать дополнительного выделения памяти, когда ключи []byte
используются для поиска записей в коллекциях map[string]: m[string(key)]
.
Вторая оптимизация позволяет избегать дополнительного выделения в выражениях for range
, когда строки преобразуются в []byte: for i,v := range []byte(str) {...}
.
18. Строки и оператор индекса
Оператор индекса, применяемый к строке, возвращает байтовое значение (byte value), а не символ (как в других языках).
Если нужно обратиться к конкретным «символам» (кодовым точкам/рунам Unicode), то используйте выражение for range
. Также вам будут полезны официальный пакет unicode/utf8 и экспериментальный utf8string (golang.org/x/exp/utf8string). utf8string включает в себя удобный метод At()
. Можно также преобразовать строку в слайс рун (slice of runes).
19. Строки — не всегда текст в кодировке UTF-8
Строковые значения необязательно должны быть представлены в виде текста в кодировке UTF-8. Здесь возможен произвольный набор байтов. Единственный случай, когда строки должны быть в кодировке UTF-8, — когда они используются как строковые литералы. Но даже они могут включать в себя данные с экранированными последовательностями.
Чтобы узнать кодировку строки, используйте функцию ValidString()
из пакета unicode/utf8.
20. Длина строк
Допустим, вы разрабатываете на Python и у вас есть такой код:
Если преобразовать его в аналогичный код на Go, то результат может вас удивить.
Встроенная функция len()
возвращает не символ, а количество байт, как это происходит с Unicode-строками в Python.
Чтобы получить такой же результат в Go, используйте функцию RuneCountInString()
из пакета unicode/utf8.
Технически функция RuneCountInString()
не возвращает количество символов, потому что один символ может занимать несколько рун.
21. Отсутствующая запятая в многострочных литералах slice/array/map
Неправильно:
Ошибки компилирования:
Правильно:
Вы не получите ошибку компилирования, если оставите замыкающую запятую при объявлении в одну строчку.
22. log.Fatal и log.Panic не только журналируют
Библиотеки для логирования часто обеспечивают различные уровни для сообщений. В отличие от других языков, пакет логирования в Go делает больше. Если вызвать его функции Fatal*()
и Panic*()
, то приложение будет закрыто.
23. Несинхронизированные операции встроенных структур данных
Некоторые возможности Go нативно поддерживают многозадачность (concurrency), но в их число не входят потокобезопасные коллекции (concurrency safe). Вы сами отвечаете за атомарность обновления коллекций. Для реализации атомарных операций рекомендуется использовать горутины и каналы, но можно задействовать и пакет sync, если это целесообразно для вашего приложения.
24. Итерационные значения для строк в выражениях range
Значение индекса (первое значение, возвращаемое операцией range
) — это индекс первого байта текущего «символа» (кодовая точка/руна Unicode), возвращённый во втором значении. Это не индекс текущего «символа», как в других языках. Обратите внимание, что настоящий символ может быть представлен несколькими рунами. Если вам нужно работать именно с символами, то стоит использовать пакет norm (golang.org/x/text/unicode/norm).
Выражения for range
со строковыми переменными пытаются интерпретировать данные как текст в кодировке UTF-8. Если они не распознают какую-либо последовательность байтов, то возвращают руны 0xfffd (символы замены Unicode), а не реальные данные. Если в вашей строке хранятся произвольные данные (не UTF-8), то для сохранения преобразуйте их в байт-слайсы.
25. Итерирование хеш-таблиц (map) с помощью выражения for range
На этот подводный камень натыкаются те, кто ожидают, что элементы будут располагаться в определённом порядке (например, отсортированные по значению ключа). Каждая итерация хеш-таблицы приводит к разным результатам. Среда исполнения (runtime) Go пытается сделать всё возможное, рандомизируя порядок итерирования, но ей это не всегда удаётся, поэтому вы можете получить несколько одинаковых итераций (например, пять) подряд.
А если вы используете Go Playground (https://play.golang.org/), то всегда будете получать одинаковые результаты, потому что код не перекомпилируется, пока вы его не измените.
26. Сбойное поведение в выражениях switch
Блоки case
в выражениях switch
по умолчанию прерываются (break). В других языках поведение по умолчанию другое: переход (fall through) к следующему блоку case
.
Можно заставить блоки case переходить принудительно с помощью выражения fallthrough
в конце каждого блока. Можно также переписать ваше выражение switch
, чтобы в блоках использовались списки выражений.
27. Инкременты и декременты
Во многих языках есть операторы инкрементирования и декрементирования. Но в Go не поддерживаются их префиксные версии. Также нельзя в одном выражении использовать оба этих выражения. Неправильно:
Ошибки компилирования:
Правильно:
28. Побитовый NOT-оператор
Во многих языках символ ~ используется в качестве унарной NOT-операции (aka побитовое дополнение, bitwise complement), однако в Go для этого применяется XOR-оператор (^). Неправильно:
Ошибка компилирования:
Правильно:
Кого-то может запутать, что ^ в Go — это XOR-оператор. Если хотите, выражайте унарную NOT-операцию (например, NOT 0x02
) с помощью бинарной XOR-операции (например, 0x02 XOR 0xff
). Это объясняет, почему ^ используется для выражения унарной NOT-операции.
Также в Go есть специальный побитовый оператор AND NOT (&^), который легко принять за оператор NOT. AND NOT выглядит как специальная функция/хак ради поддержки A AND (NOT B)
без обязательного использования фигурных скобок.
29. Различия приоритетов операторов
Помимо «довольно понятных» (bit clear) операторов (&^), в Go есть набор стандартных операторов, используемых многими другими языками. Но их приоритеты в данном случае не всегда такие же.
30. Неэкспортированные поля структур не кодируются
Поля структур (struct fields), начинающиеся со строчных букв, не будут кодироваться (JSON, XML, GON и т. д.), так что при декодировании структуры вы получите в этих неэкспортированных полях нулевые значения.
31. Выход из приложений с помощью активных горутин
Приложение не будет ждать завершения ваших горутин. Новички часто об этом забывают. Все когда-то начинают — в таких ошибках нет ничего стыдного.
Вы увидите:
Одно из самых популярных решений — переменная WaitGroup
. Это позволит главной горутине ожидать завершения работы всех рабочих горутин. Если ваше приложение использует долго выполняемые рабочие горутины с циклами обработки сообщений, то вам понадобится как-то сигнализировать им о том, что пора выходить. Можно отправлять каждой такой горутине сообщение kill
. Или закрывать каналы, из которых рабочие горутины получают данные: это простой способ сигнализировать оптом.
Если запустить это приложение, вы увидите:
Похоже, все горутины закончили работать до выхода главной горутины. Замечательно! Однако вы увидите и это:
Нехорошо! Что происходит? Откуда взялась взаимоблокировка? Ведь все вышли и выполнили wg.Done()
. Приложение должно работать.
Блокировка возникает, потому что каждый рабочий получает копию исходной переменной WaitGroup
. И когда все они выполняют wg.Done()
, это никак не влияет на переменную WaitGroup
в главной горутине.
Теперь всё работает правильно.
32. При отправке в небуферизованный канал данные возвращаются по мере готовности получателя
Отправитель не будет заблокирован, пока получатель обрабатывает ваше сообщение. В зависимости от машины, на которой выполняется код, получающая горутина может и не иметь достаточно времени на обработку сообщения, прежде чем продолжится выполнение отправителя.
33. Отправка в закрытый канал приводит к panic
Получение из закрытого канала безопасно. Возвращаемое значение ok
в получаемом выражении (receive statement) станет false
, что говорит о том, что никакие данные не были получены. Если вы получаете из буферизованного канала, то получите сначала буферизованные данные, а когда они закончатся, выражение ok
станет false
.
Отправка данных в закрытый канал приводит к panic. Это задокументированное поведение, но оно не всегда интуитивно ожидаемо разработчиками, которые могут считать, что поведение при отправке будет аналогично поведению при приёме.
Решение зависит от вашего приложения. Это может быть небольшое изменение кода — или архитектуры, если потребуется. В любом случае удостоверьтесь, что приложение не пытается отправлять данные в закрытый канал. Пример с багом можно исправить, сигнализируя через специальный канал отмены (special cancellation channel) остальным рабочим горутинам, что их результаты больше не нужны.
34. Использование «nil»-каналов
В канале nil
операции отправки и приёма блокируются навсегда. Это хорошо задокументированное поведение, но оно может стать сюрпризом для новичков.
При выполнении этого кода вы увидите ошибку runtime наподобие fatal error: all goroutines are asleep - deadlock!
Это поведение можно использовать для динамического включения и отключения блоков case
в выражении select
.
35. Методы, принимающие параметры по значению, не меняют исходных значений
Параметры методов — это как обычные аргументы функций. Если они объявляются значением, то функция/метод получает копию вашего аргумента (receiver argument). Изменения в принятом значении не повлияют на исходное значение, если значение — переменная хеш-таблицы (map) или слайса и вы обновляете элементы коллекции или если обновляемые поля в значении — это указатели.
36. Закрытие тела HTTP-ответа
Делая запрос с помощью стандартной HTTP-библиотеки, вы получаете переменную HTTP-ответа. Даже если вы не читаете тело ответа, всё равно нужно его закрыть. Обратите внимание: это относится и к пустым ответам. О них очень легко забыть, особенно новичкам. Некоторые новички пытаются закрывать тело ответа, но в неправильном месте.
Этот код будет работать с успешными HTTP-запросами, но в случае сбоя переменная resp
может быть nil
, что приведёт к runtime panic.
Самый распространённый способ закрыть тело ответа — с помощью вызова defer
после проверки ошибочности HTTP-ответа.
В большинстве случаев, когда возникают сбои HTTP-запросов, переменная resp
будет nil
, а переменная err — non-nil
. Но при сбое переадресации обе переменные будут non-nil
. Это означает возникновение утечки.
Её можно предотвратить, добавив вызов для закрытия тел ответов non-nil
в блоке обработки ошибок HTTP-запросов. Другое решение: использовать один вызов defer
для закрытия тел ответов для всех сбойных и успешных запросов.
Исходная реализация resp.Body.Close()
также считывает и отклоняет данные оставшихся тел ответов. Благодаря этому HTTP-соединение может быть повторно использовано для другого запроса, если включено поведение keep alive
. Поведение самого последнего HTTP-клиента отличается. Теперь вы ответственны за чтение и отклонение оставшихся данных ответов. Если этого не сделать, то HTTP-соединение вместо повторного использования может быть закрыто. Надеюсь, этот маленький подводный камень будет задокументирован в Go 1.5.
Если для вашего приложения важно повторно использовать HTTP-соединения, то в конце логики обработки ответа может понадобиться добавить что-то вроде этого:
Это будет необходимо, если вы не считываете всё тело ответа немедленно, например при обработке ответов JSON API с помощью подобного кода:
37. Закрытие HTTP-соединений
Некоторые HTTP-серверы какое-то время держат сетевые соединения открытыми (согласно спецификации HTTP 1.1 и серверной конфигурации keep alive
). По умолчанию стандартная HTTP-библиотека закрывает соединения, только когда об этом просит целевой HTTP-сервер. Тогда при определённых условиях в вашем приложении могут закончиться сокеты / файловые дескрипторы.
Можно попросить библиотеку закрывать соединение после завершения вашего запроса, задав значение true
в поле Close
переменной запроса.
Другое решение: добавить заголовок запроса Connection
и задать ему значение close
. Целевой HTTP-сервер тоже должен ответить заголовком Connection: close
. Когда библиотека его увидит, она закроет соединение.
Можно ещё глобально отключить повторное использование HTTP-соединений. Для этого создайте кастомную конфигурацию HTTP-транспорта.
Если вы отправляете на один сервер много запросов, то этого достаточно для сохранения соединения открытым. Но если приложение за короткое время шлёт один-два запроса на много разных серверов, то лучше закрывать соединения сразу после получения ответов. Также можно увеличить лимит на количество открытых файлов. Что лучше — зависит от вашего приложения.
38. Десериализация (unmarshalling) JSON-чисел в интерфейсные значения
Когда вы декодируете/десериализуете JSON-данные в интерфейс, Go по умолчанию обращается с числовыми значениями в JSON как с числами float64
. Значит, вот такой код вызовет panic:
Runtime Panic:
panic: interface conversion: interface is float64, not int
Если JSON-значение, которое вы пытаетесь декодировать, целочисленное, есть несколько вариантов.
Использовать значение с плавающей запятой как есть :-)
Преобразовать значение с плавающей запятой в целочисленный тип, который вам нужен.
Использовать тип
Decoder
для десериализации JSON и представления JSON-чисел с помощью интерфейсного типаNumber
.Можно использовать строковое представление вашего значения
Number
, чтобы десериализовать его в другой числовой тип:Использовать тип
struct
, который преобразует (maps) числовое значение в нужный вам числовой тип.Использовать
struct
для преобразования числового значения в типjson.RawMessage
, если требуется отложить декодирование значения. Это полезно, если вы должны выполнить декодирование условного JSON-поля (conditional field) в условиях возможности изменения структуры или типа поля.
39. Сравнение struct, array, slice и map
Можно использовать оператор эквивалентности ==
для сравнения переменных структур, если каждое поле структуры можно сравнить с помощью этого оператора.
Если хоть одно из полей несравниваемо, то применение оператора эквивалентности приведёт к ошибке компилирования. Обратите внимание, что сравнивать массивы можно только тогда, когда сравниваемы их данные.
Go предоставляет несколько вспомогательных функций для сравнения переменных, которые нельзя сравнивать с помощью операторов сравнения.
Самое популярное решение: использовать функцию DeepEqual()
из пакета reflect.
Помимо невысокой скорости (что может быть критично для вашего приложения), DeepEqual()
имеет свои собственные подводные камни.
DeepEqual()
не считает пустой слайс эквивалентным nil
-слайсу. Это поведение отличается от того, что вы получите при использовании функции bytes.Equal()
: она считает эквивалентными nil
и пустые слайсы.
DeepEqual()
не всегда идеальна при сравнении слайсов.
Если ваши байт-слайсы (или строки) содержат текстовые данные, то, когда понадобится сравнить значения без учёта регистра, вы можете использовать ToUpper()
или ToLower()
из пакетов bytes и strings (прежде чем прибегнуть к ==
, bytes.Equal()
или bytes.Compare()
). Это сработает для англоязычных текстов, но не для многих других языков. Так что лучше выбрать strings.EqualFold()
и bytes.EqualFold()
.
Если ваши байт-слайсы содержат секретные данные (криптографические хеши, токены и т. д.), которые нужно сравнивать с предоставленной пользователями информацией, обойдитесь без reflect.DeepEqual()
, bytes.Equal()
или bytes.Compare()
. Эти функции сделают приложение уязвимым к атакам по времени. Чтобы избежать утечки информации о времени, используйте функции из пакета crypto/subtle (например, subtle.ConstantTimeCompare()
).
40. Восстановление после panic
Функцию recover()
можно использовать для поимки/перехвата panic. Это получится, только если вызвать её в блоке defer.
Некорректно:
Правильно:
Вызов recover()
сработает, только если будет выполнен в блоке defer.
Неправильно:
41. Обновление и привязка значений полей в slice, array и map в выражениях for range
Сгенерированные в выражениях range
значения данных — это копии реальных элементов коллекций, а не ссылки на исходные элементы. Стало быть, обновление значений не изменит исходные данные. Кроме того, если взять адрес значения, то вы не получите указатель на исходные данные.
Если вам нужно обновить исходное значение записи в коллекции, то для доступа к данным воспользуйтесь индексным оператором.
Если коллекция содержит значения указателей, то правила немного меняются. Вам всё ещё нужно использовать индексный оператор, чтобы исходная запись указывала на другое значение. Но вы можете обновлять данные, хранящиеся в целевом месте, с помощью второго значения в выражении for range
.
42. «Скрытые данные» в слайсах
При перенарезке получившийся слайс будет ссылаться на массив исходного слайса. Не забывайте об этом. Иначе может возникнуть непредсказуемое потребление памяти, когда приложение разместит в ней крупные временные слайсы и создаст из них новые, чтобы ссылаться на небольшие куски исходных данных.
Чтобы избежать этой ошибки, удостоверьтесь, что копируете нужные данные из временного слайса (вместо перенарезки).
43. «Повреждение» данных в слайсах
Допустим, вам нужно переписать путь (хранящийся в слайсе). Чтобы ссылаться на каждую папку, вы его перенарезаете, изменяя имя первой папки, а затем комбинируете имена в новый путь.
Так не сработает. Вместо AAAAsuffix/BBBBBBBBB вы получите AAAAsuffix/uffixBBBB. Причина в том, что слайсы обеих папок ссылаются на один и тот же массив данных из исходного слайса пути. То есть исходный путь тоже изменился. Это может быть проблемой для вашего приложения. Ее можно решить, разместив в памяти новые слайсы и скопировав туда нужные данные. Другой выход: использовать полное выражение слайса (full slice expression).
Дополнительный параметр в полном выражении управляет ёмкостью нового слайса. Добавление этого параметра к новому слайсу запустит размещение в памяти нового буфера вместо перезаписи данных во второй слайс.
44. «Устаревшие» слайсы
На одни и те же данные могут ссылаться несколько слайсов. Например, когда вы создаёте новый слайс на основе имеющегося. Если такое поведение важно для вашего приложения, позаботьтесь об «устаревших» слайсах. В какой-то момент добавление данных в один из слайсов приведёт к размещению в памяти нового массива, потому что в старом не хватит места для новых данных. Теперь на старый массив (со старыми данными) ссылаются несколько слайсов.
45. Методы и объявления типов
Когда вы определяете новый тип на основе существующего (не интерфейсного), тем самым вы создаёте объявление типа и не наследуете методы, объявленные в существующем типе. Неправильно:
Ошибки компилирования:
Если вам нужны методы из исходного типа, вы можете задать новый тип структуры, встроив исходный в качестве анонимного поля. Правильно:
Объявления интерфейсных типов также сохраняют свои наборы методов. Правильно:
46. Как выбраться из кодовых блоков for switch и for select
уровень: более опытный
Выражение break
без метки (label) выводит вас только из внутреннего блока switch/select
. Если использовать выражение return
— не вариант, тогда лучший выход — задать метку для внешнего цикла.
То же самое и с выражением goto
…
47. Итерационные переменные и замыкания в выражениях for
Самая распространённая проблема в Go. Итерационные переменные в выражении for
снова используются для каждой итерации. Это значит, что каждое замыкание (aka функциональный литерал), созданное в вашем цикле for
, будет ссылаться на ту же переменную (и они получат значение переменной в тот момент, когда начнётся исполнение их горутин).
Некорректно:
Простейшее решение (не требующее менять горутины): сохранить текущее значение итерационной переменной в локальной переменной внутри блока цикла for
.
Правильно:
Другое решение: передать текущую итерационную переменную анонимной горутине в виде параметра. Правильно:
Здесь чуть более сложная версия ловушки. Некорректно:
Правильно:
Как вы думаете, что вы увидите (и почему), запустив этот код?
48. Вычисление аргумента блока defer (Deferred Function Call Argument Evaluation)
Аргументы для вызовов отложенных функций вычисляются тогда же, когда и выражение defer
(а не когда на самом деле выполняется функция).
49. Вызов блока defer
Отложенные вызовы исполняются в конце содержащей их функции, а не в конце содержащего их кодового блока. Новички часто ошибаются, путая правила исполнения отложенного кода с правилами определения области видимости переменной. Это может стать проблемой, если вы долго выполняете функцию с циклом for
, которая во время каждой итерации пытается отложить (defer
) вызовы очистки ресурсов.
Один из способов решения проблемы — обернуть кодовый блок в функцию.
Другое решение: избавиться от выражения defer
:-)
50. Ошибки при приведении типов
Сбойные утверждения типов возвращают «нулевое значение» для целевых типов, использованных в операторе утверждения. Наложившись на сокрытие переменных, это может привести к непредсказуемому поведению. Некорректно:
Правильно:
51. Блокированные горутины и утечки ресурсов
В выступлении «Go Concurrency Patterns» на конференции Google I/O в 2012-м Роб Пайк рассказал о нескольких фундаментальных concurrency-шаблонах. Один из них — извлечение первого результата.
Для каждой копии (replica) поиска функция запускает отдельную горутину. Каждая из горутин отправляет свои поисковые результаты в канал результатов. Возвращается первое значение из канала.
А что с результатами от других горутин? И что насчёт них самих?
В функции First()
канал результатов не буферизован. Это значит, что возвращается только первая горутина. Все остальные застревают в попытке отправить свои результаты. Получается, что если у вас более одной копии (replica), то при каждом вызове происходит утечка ресурсов.
Чтобы этого избежать, все горутины должны завершиться (exit). Одно из возможных решений: использовать достаточно большой буферизованный канал результатов, способный вместить все результаты.
Другое решение: использовать выражение select
со сценарием (case) default
и буферизованный канал на одно значение. Сценарий default
позволяет быть уверенным, что горутина не застряла, даже если канал результатов не может принимать сообщения.
Также можно использовать специальный канал отмены (special cancellation channel) для прерывания рабочих горутин.
Почему в презентации есть такие баги? Роб Пайк просто не хотел усложнять слайды (slides) своей презентации. Такое объяснение имеет смысл, но это может быть проблемой для новичков, которые используют код, не думая о вероятных проблемах.
52. Применение методов, принимающих значение по ссылке (pointer receiver), к экземплярам значений
Пока значение адресуемо (addressable), к нему можно применять метод, принимающий значение по ссылке. Иными словами, в некоторых случаях вам не нужно иметь версию метода, принимающего параметр по значению. Но не каждая переменная адресуема. Элементы хеш-таблицы (map) неадресуемы. Переменные, на которые ссылаются через интерфейсы, тоже неадресуемы.
Ошибки компилирования:
53. Обновление полей значений в хеш-таблице
Если у вас есть таблица, состоящая из структур, то вы не можете обновлять отдельные структурные поля. Неправильно:
Ошибка компилирования:
Это не работает, потому что элементы таблицы не адресуемы. Новичков может дополнительно путать то, что элементы слайсов — адресуемы.
Обратите внимание, что когда-то в одном из компиляторов (gccgo) можно было обновлять поля элементов таблицы. Но это быстро пофиксили :-) Также считалось, что такая возможность появится в Go 1.3. Но в то время это было не так важно, так что фича всё ещё висит в списке todo. Первое обходное решение: использовать временную переменную.
Второе обходное решение: использовать хеш-таблицу с указателями.
Кстати, что будет, если выполнить этот код?
54. nil-интерфейсы и nil-интерфейсные значения
Это вторая по распространённости ловушка Go. Интерфейсы — не указатели, даже если они так выглядят. Интерфейсные переменные будут nil
только тогда, когда их типы и поля значений будут nil
.
Интерфейсный тип и поля значений заполняются на основе типа и значения переменной, использованной для создания соответствующей интерфейсной переменной. Если вы попытаетесь проверить, эквивалентна ли переменная nil
, то это может привести к непредсказуемому поведению.
Остерегайтесь этой ловушки, когда у вас есть функция, возвращающая интерфейсы. Некорректно:
Правильно:
55. Переменные стека и кучи
Не всегда известно, находится ли переменная в стеке или в куче. Если в С++ создать переменную с помощью оператора new
, то она всегда будет в куче. В Go место размещения переменной выбирает компилятор, даже если используются функции new()
или make()
. Компилятор делает выбор на основании размера и результата «анализа локальности» (escape analysis). Это также означает, что можно возвращать ссылки на локальные переменные, что недопустимо в других языках, например в С и С++.
Если вы хотите знать, где находятся переменные, то передайте -gcflags -m
в go build
или go run
(например, go run -gcflags -m app.go
).
56. GOMAXPROCS, согласованность (concurrency) и параллелизм
Go 1.4 и ниже используют только один тред контекста исполнения / ОС. Это значит, что в каждый момент времени может исполняться лишь одна горутина. Начиная с Go 1.5 количество контекстов исполнения стало равно количеству логических процессорных ядер, возвращаемому runtime.NumCPU()
. Оно может не совпадать с общим количеством логических ядер в системе, в зависимости от настроек привязки CPU для процесса. Количество можно настроить, изменив переменную среды GOMAXPROCS
или вызвав функцию runtime.GOMAXPROCS()
.
Существует распространённое заблуждение, что GOMAXPROCS
представляет собой количество процессоров, которые Go будет использовать для запуска горутин. Документация к функции runtime.GOMAXPROCS()
только добавляет неразберихи. Но в описании к переменной GOMAXPROCS
(https://golang.org/pkg/runtime/) говорится именно о тредах ОС.
Значение GOMAXPROCS
может превышать количество ваших процессоров, верхний предел — 256.
57. Изменение порядка операций чтения и записи
Go может менять порядок некоторых операций, но общее поведение внутри горутины, где это происходит, не меняется. Однако сказанное не относится к порядку исполнения самих горутин.
Если запустить этот код несколько раз, то можно увидеть такие комбинации переменных a
и b
:
Самая интересная комбинация — 02 — говорит о том, что b
была обновлена раньше a
.
Если нужно сохранить порядок операций чтения и записи среди нескольких горутин, то используйте каналы или соответствующие конструкции из пакета sync.
58. Диспетчеризация по приоритетам (Preemptive Scheduling)
Могут появляться разбойничьи (rogue) горутины, не дающие другим горутинам выполняться. Такое случается, если у вас есть цикл for
, не позволяющий запустить диспетчер.
Цикл for
не должен быть пустым. Проблема не исчезнет, пока в цикле содержится код, не запускающий исполнение диспетчера.
Он запускается после сборки мусора, выражений go
, операций блокирования каналов, блокирующих системных вызовов и операций блокирования. Также он может работать, когда вызвана невстроенная (non-inlined) функция.
Чтобы узнать, встроена ли вызываемая вами в цикле функция, передайте -gcflags –m
в go build
или go run
(например, go build -gcflags -m
).
Другое решение: явно вызвать диспетчер. Это можно сделать с помощью функции Gosched()
из пакета runtime.
Ссылки:
Last updated
Was this helpful?